BLAUDE, O. Automaticka diagnostika 12svodoveho EKG pomoci hlubokeho uceni [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Student Ondřej Blaude se zabýval obtížnou problematikou návrhu metody pro diagnostiku 12svodového EKG pomocí hlubokých neuronových sítí. Ve své práci vyšel z dostatečné rešerše relevantních literárních zdrojů a nastudoval některé důležité přístupy k problematice. V praktické části navrhl vlastní řešení, které je funkční, byť ve zcela základním rozsahu. Celá práce trpí tím, že jí student nevěnoval tolik času, kolik si problematika aplikace metod hlubokého učení žádá. Drtivá většina práce byla vypracována až v závěru posledního semestru a nezbyl tak čas na optimalizaci návrhu metody, řešení negativních jevů (přeučení, nízká efektivita), na zjištění důvodů nízké úspěšnosti klasifikace pro některé patologické záznamy, a další. Přestože byly cíle práce splněny, je výsledek zcela minimalistický.
Předložená diplomová práce studenta Ondřeje Blaudeho se zabývá automatickou diagnostikou 12svodoveho EKG pomoci hlubokých neuronových sítí. Na 19 stranách teorie student rozebírá elektrofyziologii srdce a frekventované srdečních patologie. Dále se zabývá metodami pro podporu diagnostiky, rozebírá jak metody konvenční, tak i založené na hlubokých neuronových sítích. Teoretická část je podpořena 25 literárními zdroji. Praktická část je podstatně stručnější a zabírá jen 10 stran. Musím podotknout, že všechny body zadání jsou v práci určitým způsobem adresovány a fakticky vzato splněny. Nicméně způsob a úroveň vypracování jsou velice minimalistické. V podstatě lze říct, že první funkční řešení, na které student přišel, je prezentováno bez pokusu o vylepšení/optimalizaci. Téměř ke každému kroku by se dala položit otázka, proč zvolil právě tuto metodu, tento parametr. Přitom z grafů na obrázku 4.8 je zřejmé že k určitému přeučení sítě dochází (PPV mezi trénovací a validační sadou vykazuje po 50 epochách cca 10% propad). I při porovnání výsledků s dalšími dvěma autory v tabulce 5.2 je zřejmé, že prostor pro zlepšení existuje, a tudíž by stálo za to další kroky podniknout. Moje poznámky/otázky/výtky k praktické části práce budu prezentovat v následujících bodech a prosím, aby byly u obhajoby diskutovány: 1) Z jakého důvodu byly zvoleny právě čtyři klasifikační třídy a podle jakých kritérií? V diskusi je sice naznačeno, že se výběr týká počtu patologií v dané skupině. Nicméně obvykle hojně zastoupená a diskutovaná patologie atriální fibrilace ve výběru chybí. Z jakého důvodu byl zkrácen dataset o cca 11 tisíc signálů dalších patologií také není v práci diskutováno. Proč se například nevytvořila 5. třída „ostatní“? 2) Problém nevyváženého datasetu byl řešen váhováním jednotlivých tříd. Nicméně váhy se počítají před rozdělením dat do skupin (trénovací, validační, testovací). Tudíž skutečné váhy při trénování nemusejí korespondovat s těmi, které byly spočteny před rozdělením. 3) Jak ovlivňuje výsledek klasifikace navržené předzpracování? Přispívá navržená pásmová filtrace (HP+DP) k lepšímu výsledku? Jak moc lze signály podvzorkovat vzhledem k funkčnosti klasifikátoru? 4) Augmentace dat je velice nedostatečná. Pouhý posun signálu o +/- 10 vzorků na signálu s 5 tisíci vzorky mnoho variability nevygeneruje. Navíc při posunu signálu se nasouvájí prvky z konce signálu na začátek a vytváří uměle nespojitosti. Existuje mnoho způsobů, jak smysluplně augmentovat data např. přičítáním šumů charakteristického pro EKG, které však uvažovány nebyly. 5) Student se nijak nepokusil modifikovat architekturu sítě, nebo alespoň optimalizovat hyperparametry sítě. Proč je např. vhodné využít konvoluční bloky s 64 filtry o délce 16 vzorků jako v literatuře ve které se student inspiroval? V citované literatuře přitom používají jinak dlouhé signály s rozdílnou vzorkovací frekvencí. 6) Student se dopustil chyby při implementaci modelu. Model využívá dvou shodných sekcí (1D Conv, BatchNorm, ReLU) v sérii dle obrázku 4.7. Dle kódu však není vstupem do druhé z těchto sekcí výsledek předchozí sekce, ale opět vstup, což je v rozporu s blokovým schématem. 7) Student se nijak v práci nezmiňuje o tom, jak nakládá se všemi dvanácti svody signálu EKG. Na všech obrázcích je vidět jen jeden svod a není popsáno jaký. Využívá neuronová síť všech 12 svodů? 8) Jestliže jsou v teoretické části práce prezentovány, metody standardní vs. metody založené na CNN, bylo by také dobré uvést výsledky standardních metod v kapitole diskuse výsledků. Formální stránku práce hodnotím opět jako slabou, která vykazuje menší či větší prohřešky. První odstavec za nadpisem se neodsazuje, tabulky se popisují ze shora, obrázky 1.3 až 1.6 mají malé rozlišení, obrázky 4.2 až 4.6 mají nízkou kvalita a nečitelný font, kapitola 223 je jen nadpis. Práce má neadekvátní abstrakt i závěr, defacto jde o rozšířený obsah, bez hodnotnější přidané informace. Způsob práce s literaturou mi přijde také nestandardní. Celá kapitola 3.1 je doslovný překlad dvou zdrojů. Není tam přidána jediná myšlenka navíc ani změněn slovosled. Jestli se to samé vztahuje i na jiné kapitoly není v mých silách kontrolovat. Celkově hodnotím práci jako podprůměrnou.
eVSKP id 150873