ČIČATKA, M. Detekce a lokalizace mikrobiálních kolonií pomocí algoritmů hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Mézl, Martin

Student Michal Čičatka vypracoval svoji práci pod vedením externího vedoucího, jehož hodnocení zde přikládám. Z mého pohledu formálního vedoucího student pravidelně konzultoval postup své práce a zaslané poznámky a komentáře k textu zpracoval. Posudek externího vedoucího Ing. et Ing. Jana Karáska, Ph.D. z firmy Bruker s.r.o.: 1) Splnění požadavků zadání. Student, Bc. Michal Čičatka, vypracoval práci na téma Detekce a lokalizace mikrobiálních kolonií pomocí algoritmů hlubokého učení. V rámci práce provedl literární rešerší souvisejících algoritmů se zaměřením na problematiku segmentace a problematiku detekce a lokalizace mikrobiálních kolonií, bez zbytečného odklánění od tématu, což vytváří solidní základ pro řešení dané problematiky. V práci byla použita rozsáhlá sada kvalitně označených dat, kterou student rozdělil ve vhodném poměru pro trénování, validaci a testování navrhovaného řešení ve třech implementovaných architekturách (UNET, ENET, a UNET++) algoritmu strojového učení. Metodika hodnocení algoritmu byla otestována v několika verzích z nichž byl jako nejvhodnějí vybrán DICE koeficient. Testování všech navržených architektur proběhlo, bylo vyhodnoceno a výsledky jsou v práci přehledně zpracovány v tabulkách a nejlepší architektura je zdůrazněna i v závěru práce. Na základě výše uvedeného a dosažených výsledků lze hodnotit zadání jako kompletně splněné. 2) Prezentační úroveň technické zprávy, logické návaznosti textu, její rozsah. Práce je vhodně členěna do kapitol, od jednoduchého základu týkajícího se algoritmů či mikrobiologické podstaty problému, postupně přechází do odbornější roviny strojového učení, architektur neuronových sítí pro segmentační účely, až po komplexní spojení všech řešených dílčích částí, návrhu evaluace úspěšnosti řešení a samotných naměřených výsledků. Kapitoly na sebe logicky navazují, čtenář se v textu neztrácí a celá práce tak působý velmi kopaktním dojmem. Rozsah práce odpovídá diplomové práci a standardům vyžadovaným VUT v Brně. 3) Formální úprava technické zprávy a její jazyková úroveň. Formální úprava práce je na velmi vysoké úrovni, čemuž nepochybně pomohlo, a to zvláště oceňuji, zpracování v profesionálním sázecím systemu LaTeX. Nemám pochyb ani o jazykové vybavenosti studenta, potažmo jazykové úrovni zpracování práce. 4) Práce s literaturou. Práci s literaturou lze taktéž hodnotit velmi kladně, zejména použití odborných publikací, které jsou přesně citovány ve všech odstavcích a převzatých obrázcích práce. 5) Správnost výsledků, případně realizačního výstupu. Správnost výsledků a vůbec celého navrženého řešení byla ověřena po praktické stránce přímo v testovací verzi softwaru určeného pro produkt MBT Pathfinder. Implementovaný algoritmus byl otestován regresními testy, prošel verifikačním procesem a byl prohlášen za funkční z pohledu oddělení vývoje i kvality a posunut do další fáze, kterou je testování v mikrobiologických laboratořích. 6) Aktivita studenta během semestru. Diplomant během řešení problému prokázal velmi dobré komunikační a nezbytné inženýrské dovednosti, vystupoval velmi aktivně a zpracovávaný úkol pravidelně konzultoval. Přírůstky řešení práce byly vidět během celého sledovaného období zpracování závěrečné práce. Hodnocení: Zkušební komisi navrhuji hodnocení práce stupněm "výborně/A" (100 bodů).

Navrhovaná známka
A
Body
100

Posudek oponenta

Vičar, Tomáš

Student se v práci zabývá sémantickou segmentací snímků mikrobiálních kolonií na Petriho miskách. Pro tuto segmentaci využívá hluboké učení, specificky umělé neuronové sítě odvozené od sítě U-Net. Vzhledem k danému tématu je v práci využito poměrně málo zdrojů, kde ve spoustě případů se jedná o nevhodné a nespolehlivé zdroje. Spousta zdrojů je navíc citována špatně. Teorie práce je popsána velmi zmateně se spoustou faktických chyb. Nejhůře je na tom kapitola „tradiční segmentační techniky“, která nejen že je v práci zcela zbytečně, ale její popis je velmi špatný a s většinou informací zde musím nesouhlasit. Metody jsou v práci popsány velmi povrchně, což podtrhuje fakt, že v práci je použit pouze jeden vzorec. Je zde popsaná spousta zbytečné a obecně známé teorie, ale věci využité v praktické části zde teoreticky popsané nejsou. V práci je pak celá řada zbytečných převzatých obrázků, které jsou navíc pro jejich pochopení zcela nedostatečně popsané. Nerozumím také zařazení R-CNN mezi segmentační sítě, a proč je zde vůbec zmiňována. Dále například u popisu U-Netu je zmíněno, že po konvolucích je obraz následně normalizován (bez vysvětlení o co se jedná) a je využit dropout, ale toto se nevyskytuje ve schématickém obrázku této sítě; také se zde píše, že se na konci sítě se aplikuje sigmoidální aktivační funkce a výstupem je pravděpodobnost přiřazení do všech segmentačních tříd, což je nesmysl. Celkově je v použitých modelech využita řada prvků, které nejsou nikde popsány ani citovány a čtenář tak nemá možnost popsané modely správně pochopit. Nepřehledné jsou pak tabulky ve výsledcích, které obsahují zbytečné hodnoty jako maximum a minimum, které vůbec nic neříkají. Výrazně pak ve výsledcích postrádám sumarizační tabulku nebo graf, kde by byly srovnané jednotlivé modely. Výsledky pro srovnání je tak nutné složitě hledat v několika tabulkách. Podobně zmatené jsou obrázky, kde namísto velké matice ukázek se v každé kapitole vyskytuje spousta jednotlivých obrázků, což je velmi nepřehledné. Pokaždé jsou zde uvedené jiné ukázky nebo v jiném pořadí, jsou zde také pouze výsledky segmentace s odkazy na vstupní obrázek na jiné straně v práci, což je výrazně nepřehledné a neinterpretovatelné. Není u nich navíc popsané, co znamenají jednotlivé barvy v těchto ukázkových obrázcích segmentací. Ve výsledcích použité grafy jsou nepřehledné, nedostatečně popsané či mají špatně popsané osy. Nesouhlasím, že mohl být použit „jako metrika kriteriální funkce koeficient Dice“, jelikož není diferencovatelný. U modelů s reziduálními bloky není nikde popsáno, kde a jak tyto bloky byli použity a tyto výsledky tak čtenáři nic neříkají. Také mi uniká smysl diagramů modelů v přílohách, které nejsou nikde popsány a jsou navíc ořezané. Velmi zvláštní je pak jev, který student označuje jako „artefakt zrna“ při předzpracování obrazu ekvalizací histogramu – přepokládám, že se zde bude jednat o nějakou chybu v implementaci. Je zmíněno, že dataset byl vytvořen v rámci jiné diplomové práce, ale na tuto práci zde není odkázáno, což považuji za závažný problém, jelikož to znemožňuje určit co je studentova práce a na co již navázal. Celkově se jedná o jednoduchou aplikaci více modelů na zcela standardní problém sémantické segmentace – v praxi to obnáší jednoduché nahrazení původní sítě jinými sítěmi, které navíc student neprogramoval, ale pouze využil dostupný kód. Dataset je převzatý a jelikož student nikde nepopisuje a v kódu nemá přípravu tohoto datasetu, tak předpokládám, že ani tímto se student nezabýval a obdržel data zcela připravená. Bez podrobnějších analýz a kvalitního popisu tedy praktickou část nepovažuji za příliš zajímavou. Dle teoretického popisu student problematice evidentně příliš nerozumí a pouze tyto metody v jejich základní formě aplikoval. Jelikož výpočetní čas byl dle práce velmi zásadní pro integraci do zařízení, rozhodně by bylo vhodné otestovat například vliv zmenšení obrázku na výslednou přesnost a rychlost. Musím však ocenit, že finální model byl integrován do přístroje a bude tak pravděpodobně reálně používán. Zadání lze tak považovat za splněné. Ovšem samotná kvalita textu je dle mého názoru špatná a na nízké úrovni je i reprezentace dosažených výsledků, proto hodnotím stupně D – 65 bodů.

Navrhovaná známka
D
Body
65

Otázky

eVSKP id 134426