Algoritmy pro detekci anomálií v datech z klinických studií a zdravotnických registrů

Loading...
Thumbnail Image
Date
Authors
Bondarenko, Maxim
ORCID
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Daná diplomová práce se zabývá problematikou detekci anomálií v datech z klinických studií a zdravotnických registrů. Cílem práce je provedení literární rešerše problematiky kvality dat ve zdravotnickém výzkumu a realizace vlastního algoritmu detekce anomálních záznamů založeného na metodách strojového učení v reálných klinických datech z běžících nebo uzavřených klinických studií či registrů. V praktické části je popsán realizovaný algoritmus detekce, který se skládá z několika častí: import datového souboru z informačního systému, předzpracování a transformace importovaných datových záznamů s proměnnými různých datových typů na numerické vektory, využití známých statistických metod pro detekce outlierů a hodnoceni kvality a přesnosti algoritmu. Výsledkem zpracování algoritmu je vektor parametrů obsahujících anomálií, který má usnadnit práci správci dat. Tento algoritmus je navřen pro rozšíření palety funkcí informačního systému (CLADE-IS) o automatické monitorování kvality dat detekcí anomálních záznamů.
This master's thesis deals with the problems of anomalies detection in data from clinical trials and medical registries. The purpose of this work is to perform literary research about quality of data in clinical trials and to design a personal algorithm for detection of anomalous records based on machine learning methods in real clinical data from current or completed clinical trials or medical registries. In the practical part is described the implemented algorithm of detection, consists of several parts: import of data from information system, preprocessing and transformation of imported data records with variables of different data types into numerical vectors, using well known statistical methods for detection outliers and evaluation of the quality and accuracy of the algorithm. The result of creating the algorithm is vector of parameters containing anomalies, which has to make the work of data manager easier. This algorithm is designed for extension the palette of information system functions (CLADE-IS) on automatic monitoring the quality of data by detecting anomalous records.
Description
Citation
BONDARENKO, M. Algoritmy pro detekci anomálií v datech z klinických studií a zdravotnických registrů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Biomedicínské inženýrství a bioinformatika
Comittee
doc. Ing. Jana Kolářová, Ph.D. (předseda) Ing. Vratislav Harabiš, Ph.D. (místopředseda) Ing. Jan Odstrčilík, Ph.D. (člen) Ing. Lukáš Smital, Ph.D. (člen) Ing. Martin Mézl, Ph.D. (člen) MUDr. Tibor Stračina, Ph.D. (člen)
Date of acceptance
2018-08-29
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Doc. Kolářová položila otázku, vysvětlete metodu strojového učení (SVM). Jak určíte hranici? Ing. Harabiš komentoval formální stránku práce a položil otázku, proč v některých případech byla využita jen euklidovská vzdálenost a v některých případech kombinace metrik. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO