CIKÁNEK, M. Detekce biologických struktur ve snímcích z TEM mikroskopu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.
Študent Bc. Martin Cikánek vypracoval diplomovú prácu pojednávajúcu o automatickej detekcii proteínových štruktúr v snímkach z krio transmisného elektrónového mikroskopu. Účelom práce bolo naštudovať zvolenú problematiku a experimentálne overiť možnosti využitia konvolučných neurónových sieti na takúto detekciu. Následné sa mal študent zoznámiť s možnosťami zhlukovej analýzy a využiť ju k zlepšeniu výsledkov predradenej neurónovej siete. Prístup študenta k riešeniu práce bol aktívny, pravidelne konzultoval postup práce a bol schopný naštudovať a aplikovať použité algoritmy. Celkovo tak hodnotím zadanie práce ako splnené, mám však výhrady k takmer úplne chýbajúcej optimalizácii procesu trénovania siete o čom svedčia aj študentom dosiahnuté výsledky, tie sú však správne a konštruktívne zhodnotené. Prezentačná, formálna a jazyková úprava predloženej správy je na veľmi priemernej úrovni a obsahuje viacero nedostatkov – chaotické členenie, nejasné popisy, príliš krátky alebo naopak zbytočne dlhý rozsah niektorých kapitol, atď. Študent v práci uvádza 46 literárnych zdroj ich citácie však často nie sú úplné. Aj napriek uvedeným nedostatkom musím uznať, že študent bol schopný neľahké zadanie práce (detekcia proteínových štruktúr je ťažká aj pre komerčne dostupné SW) spracovať na uspokojivej úrovni. Diplomovú prácu odporúčam k obhajobe D (65).
Student Bc. Martin Cikánek se ve své diplomové práci zabývá detekcí biologických struktur ve snímcích z transmisního elektronového mikroskopu s využitím metod strojového učení. Po formální stránce je práce na průměrné úrovni. Celkově dobrý dojem je snižován řadou nekvalitních převzatých obrázků (např. Figure 1, 6, 16), téměř naprostou absencí odkazů na obrázky v textu, popisy obrázků a tabulek nejsou samovysvětlující. Tato kombinace velmi snižuje schopnost rychle se orientovat v práci, protože k pochopení nedostatečně popsaného obrázku je nutné jeho vysvětlení vyhledat v textu, ovšem bez odkazu na tento obrázek je to velmi zdlouhavé. Názvy a řazení kapitol navíc není pochopitelné a v mnoha případech nelze jednoduše odlišit, která část práce je autorovým vlastním přínosem. Kap. 7.1 obsahuje velmi zmatený popis dostupných dat, jakož i jejich předzpracování, z něhož není jasné, kolik, jakých a jak upravených dat bylo v práci použito, a zda data student snímal a značil sám. Popis efektivity jednotlivých architektur CNN na str. 42 patří do teoretické části; zde bych očekával vyhodnocení provedené studentem na vlastních datech. Po jazykové stránce práce obsahuje řadu překlepů a vět s nevhodným slovosledem. K odborné stránce práce mám řadu výhrad. Student zcela zbytečně nebo zbytečně detailně popisuje některé teoretické aspekty, které ve své práci později nijak nevyužívá ani dále neřeší tuto problematiku. Řada kapitol, obrázků a tabulek tak nijak nepřispívá k vysvětlení problematiky ani dosažených výsledků (např. oddělená kapitola 2, segmentační přístupy v kapitole 3, kap. 1.2.2, 3.4.1, 3.4.4, popis rutinní programátorské práce v kap. 7.1 a 7.2, zbytečné Figure 6, 7, 8, 9, 11, 12, 15, 16, duplicitní kapitoly 7.4 až 7.6 a duplicitní Figure 24-28 s 29 a 30-37). Tabulky 2 a 5 patří spíše do příloh. Naopak informace, které jsou důležité nejsou uvedeny v práci vůbec. Příkladem může být rešerše detekčních algoritmů jako např. Viola-Jones a dalších používaných detekční CNN jako YOLO, studentem používaná RFCN s nejlepšími dosaženými výsledky apod. Dále postrádám detailnější rešerši algoritmů přímo určenou k detekci biologických struktur v TEM snímcích (namátkou vybrané příklady viz reference [1], [2]). Vzorec 8 na straně 51 je chybný – popisuje FNR nikoliv FPR, stejně tak je chybně popsán FNR dále v textu. Student ve své práci používá velké množství zdrojů, avšak řada z nich jsou neidentifikovatelné online zdroje bez uvedení druhu, autora nebo alespoň vydavatele. Jejich řazení v seznamu literatury není ani dle abecedního pořádku ani dle výskytu. Celkově negativní dosažené výsledky po aplikaci shlukové analýzy jsou očekávatelné vzhledem k aplikaci jednoduchého shlukování na výsledky mnohem sofistikovanějšího algoritmu, navíc použití takovéhoto přístupu potlačení falešných detekcí je možné použít pouze v případech velmi sensitivních detektorů (TPR více než 90 %). Výše uvedená negativa jsou však částečně vyvážena značným množstvím práce (předzpracování dat, naučení 4 detekčních modelů využívající moderních metod strojového učení), kterou student musel na diplomové práci provést a správným celkovým zhodnocením výsledků v závěru práce. Celkově považuji zadání za splněné, práci doporučuji k obhajobě a hodnotím stupněm D (60 bodů). [1] M. van Heel, ‘Multivariate statistical classification of noisy images (randomly oriented biological macromolecules)’, Ultramicroscopy, vol. 13, no. 1–2, pp. 165–183, Jan. 1984. [2] Z. Yang, J. Fang, J. Chittuluru, F. J. Asturias, and P. A. Penczek, ‘Iterative Stable Alignment and Clustering of 2D Transmission Electron Microscope Images’, Structure, vol. 20, no. 2, pp. 237–247, Feb. 2012.
eVSKP id 118376