PŠURNÝ, M. Big data analýzy a statistické zpracování metadat v archivu obrazové zdravotnické dokumentace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.

Posudky

Posudek vedoucího

Harabiš, Vratislav

Student se ve své práci měl zabývat metodami big data analýzy metadat v archívu obrazové zdravotnické dokumentace. Zadání práce bylo vytvořeno ve spolupráci s firmou OR-CZ. Student k práci přistupoval aktivně. I přes relativně velké obtíže se získáním vhodných trénovacích dat se to studentovi podařilo. Protože student konzultoval především s odborným konzultantem Ing. Svatoplukem Benešem uvádím jeho vyjádření k práci:“ K jednotlivým bodům zadní: 1) Provedenou rešerši považuji za dostačující pro další navazující kroky diplomové práce a v souladu se zadáním. 2) Metody, kterým se práce věnuje, jsou algoritmy primárně zaměřené na základní získání metadat z DICOM formátu, práce se již méně věnuje rozboru a návrhu vhodných metod pro získání využitelných informací (příp. čištění, validace a systematizace) z těchto metadat. 3) Práce se věnuje některým konkrétním metadatům (tagům), které nesou využitelné a zpracovatelné informace, chybí mi tam ale komplexnější pohled a systematičtější vyhodnocení celého souboru metadat z DICOM slovníku. 4) Práce se podobně jako v předchozím bodě soustředí na konkrétní metadata a chybí mi zde hlubší zamyšlení nad významem a využitelností informací. 5) Součástí práce jsou v souladu se zadáním navržené algoritmy pro primární získání dat z DICOM souborů a jejich převedení do hromadně zpracovatelné formy. 6) Navržené algoritmy z předchozího kroku byly v souladu se zadáním implementovány v prostředí MATLAB, byla ověřena i jejich správná funkčnost při zpracování vzorků dat. 7) Diskuze dosažených výsledků je zaměřená na konkrétní jednotlivá zjištění a nelze z ní plně posoudit k jakým celkovým závěrům student práci dospěl ať už pozitivním či negativním, což je trochu škoda. Během diplomové práce probíhaly poměrně časté konzultace a kladně hodnotím snahu autora posunovat se dopředu. Klíčovým bodem pro úspěšné zpracování tématu ale bylo získání vhodného reprezentativního vzorku dat, nad kterými bude provedena analýza a návrh možností zpracování. Tuto podmínku se vzhledem k časovým a dalším objektivním možnostem v rámci diplomové práce podařilo naplnit pouze částečně i přesto, že byla navázána spolupráce s druhou největší fakultní nemocnicí v ČR (FN Brno). Soubor dat, se kterým autor práce měl možnost pracovat, se nejeví dostatečně reprezentativní do té míry, aby bylo možno správně zobecnit poznatky z jejich zpracování. Zjevně se tento fakt podepsal na výsledcích celé práce a označil bych to za objektivní příčinu. V práci jsou poměrně dobře zpracovány výchozí informace. Při dalším praktickém získávání a zkoumání dat se student zjevně potýkal s objektivními praktickými obtížemi a celé téma z toho pohledu možná i přesahuje časový rámec vyhrazený pro diplomovou práci. I přes tento zásadní fakt jsou v práci nastíněny možnosti, směry a aspekty pro zpracování metadat zdravotnické obrazové dokumentace a dá se na ni navázat. Pozornost zasluhuje např. použití heat mapy pro analýzu výskytu a využitelnosti určitého typu metadat, které se mi jeví jako velmi užitečné. Slabší stránku práce je možno vidět v malé míře zobecnění výsledků analýzy dat a učiněných závěrů, které jsou příliš zaměřeny na konkrétní výskyty informací ve zpracovávaném vzorku dat.“ Vzhledem k uvedeným výtkám navrhuji hodnocení 60/D.

Navrhovaná známka
D
Body
60

Posudek oponenta

Kolář, Radim

Diplomant Michal Pšurný se ve své diplomové práci zabývá analýzou dat obsažených v DICOM souborech produkovaných různými zobrazovacími modalitami z klinické praxe. Diplomant se zaměřil na extrakci dat z hlavičky DICOM souborů a analyzoval zde obsažená data. Za tímto účelem se seznámil s tvorbou regulárních výrazů a využil je pro separaci dat. Získané výsledky autor vizualizoval a zhodnotil. Dosažená zjištění jsou v podstatě očekávaná. Největší slabinou práce je dle mého názoru nedostatečná analýza dat. Statistická analýza dat se omezuje pouze na informace o procentuálním vyplnění jednotlivých tagů. Autor v práci diskutuje, více než dosažené výsledky, spíše to, co by bylo možné z dat získat. Není jasné, proč tyto analýzy autor nevykonal (např. filtr pro zjištění instituce či typu vyšetření), či se o to alespoň nepokusil. Z hlediska zadání postrádám k bodu 1 informace o statistických metodách používaných pro zpracování zdravotnických dat velkého rozsahu. Je to zřejmě dáno tím, že tento typ analýzy pak není v práci využit. V bodu 6 je uvedeno, že by měl být navržený algoritmus filtrace dat implementovaný na DICOM serveru. Z práce není zcela jasný, zda k tomu došlo. Přiloženy jsou zdrojové soubory pro Matlab. Práce je rozsahem malá – samotný text je na rozložen na 40 stran včetně seznamu literatury. Je psána přehledně a výstižně, s minimem formálních chyb. Autor v práci zmiňuje, že data byla získána až během měsíce dubna, což zřejmě zapříčinilo skluz v jejich zpracování a analýze. I přes tuto objektivní příčinu však shledávám práci velmi slabou a hodnotím ji stupněm E/52b.

Navrhovaná známka
E
Body
52

eVSKP id 102377