KOZLOVÁ, D. Detekce anatomických struktur v CT datech s využitím konvolučních neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Studentka v rámci své práce nastudovala problematiku hlubokého učení, neuronových sítí, zejména konvolučních. Orientaci v daném tématu prokazuje vhodně členěný teoretický rozbor práce s logickou strukturou a návazností. Oceňuji rozsáhlejší a podrobnou literární rešerši vybraných publikovaných přístupů, kterými se inspirovala při návrhu vlastního řešení. Praktická část obsahuje návrh vlastní architektury konvoluční sítě, vhodný pro danou problematiku ve spojení s detektory význačných oblastí, čímž vytvořila komplexní algoritmus pro detekci 11 zvolených orgánů. Implementace probíhala s využitím knihovny TensorFlow ve volně dostupném jazyce Python, jehož syntaxi studentka nastudovala nad rámec zadání. Dosažené výsledky detekce jsou vhodně prezentovány a dostatečně diskutovány. Formální stránka práce je na dobré úrovni s minimem chyb a překlepů. Studentka v rámci své práce využívala relevantní odbornou literaturu převážně v anglickém jazyce, kterou také řádně cituje. Během semestru využívala konzultací, přicházela s dílčími výsledky a konkrétními dotazy. Konstatuji, že studentka splnila všechny body zadání, její přístup i předložená práce prokazují schopnosti pracovat na řešení odborných problémů a vytvořit inženýrské dílo na velmi dobré úrovni. Doporučuji k obhajobě a hodnotím stupněm A – 98.
Uchazečka se ve své diplomní práci zabývá využitím konvolučních neuronových sítí pro detekci některých anatomických objektů v CT datech. Jedná se o problematiku velmi aktuální a s hlediska studentky náročnou jak v teoretické oblasti, protože příslušnou látku si musela nastudovat do značné míry individuálně, tak v oblasti implementace vzhledem ke složitosti příslušných algoritmů. V zásadě lze konstatovat, že studentka daný nesnadný úkol velmi dobře zvládla, včetně vyhodnocení experimentálních výsledků. Nicméně, vzhledem k tomu, že práce se zřejmě uchází o nejvyšší klasifikaci, je účelné upozornit i některé nedostatky, vyplývající patrně zejména z nezkušenosti. Po teoretickém přehledu v kap. 1 a 2 následuje v kap. 3 přehled prostudované související časopisecké literatury, ukazující na zájem studentky seznámit se s publikovanými postupy ve značné šíři. Bohužel místy je popis – ač poměrně rozsáhlý – dosti povrchní, takže principy některých zajímavých a v práci později využitých přístupů zůstaly nevysvětleny – např. fáze (a) a (b) metody R-CNN (kap. 3.1). V kap. 4 je stručně komentováno vytvoření databáze z dostupných CT snímků. Vlastní práce v kap. 5 se pak týká návrhu architektury CNN a jejího učení. Architektura je patrně výsledkem experimentování a/nebo nějakého rozboru; je škoda, že tato fáze není více popsána. V rámci popisu učení je zajímavé konstatování, že je v tomto případě obtížné nějak „lidsky“ interpretovat vytvořené filtry (na rozdíl od běžného povědomí o CNN). Finální program popsaný v kap.6 obsahuje kromě vlastní klasifikace pomocí CNN a následné eliminace nesprávných detekcí také část, vyhledávající oblasti potenciálně obsahující hledané objekty; to je fakticky rozšíření oproti původnímu znění zadání. Jde o nesnadný problém, zde řešený dvěma přístupy (R-CNN algoritmem patrně převzatým - vzhledem k absenci podrobnějšího popisu - jako černou skřínku, a méně efektivním, ale transparentním přístupem s posuvným oknem). Pro implementaci navržených algoritmů (kap. 7) použila diplomantka moderních softwarových prostředků – prostředí jazyka Python s využitím knihovny TensorFlow, jejíž grafické výstupy program dobře ilustrují. Účelně dále využila možnosti hardwarově podporované masivní paralelizace výpočtů na grafické kartě. Získané výsledky jsou podrobně dokumentovány v kap. 8. Zde je poněkud nejasný prvý způsob z dvojího hodnocení klasifikace. Druhý přístup je evidentní, ale je otázka, zda v prvém je zařazení negativních výsledků individuální klasifikace v objektových třídách do pozadí korektní. Pokud jde o křížovou validaci, lze asi větě „ v každé ze skupin se tedy (?) nacházely různé snímky, ale od stejných pacientů“ rozumět tak, že náhodný výběr umožňoval, že se ve skupině sejdou i snímky téhož pacienta, patrně nikoli, že skupina je tvořena výhradně jedním pacientem. U druhého způsobu lze pak namítnout, že umělým vyloučením této možnosti je náhodnost výběru zpochybněna. Problém ovšem zřejmě vyplývá z poměrně malé dostupné databáze dat. Grafy na obr. 8.2, 8.5 a 8.9 – pokud správně rozumím – by měly patrně být označeny jako závislosti na požadované velikosti překryvu (nikoli na překryvu jako takovém). V textu se vyskytují některé nedokonalé nebo neobratné formulace, popř. s jazykovými prohřešky či nikoli nezbytnými anglismy, např.: - str. 9: Hluboké(ho?) učení … je metoda strojového učení, jedná se o postup samostatného učení počítačem něčeho nového, bez přímého řízení programem (??) - str .10: … zpracováním signálů a informací (signál není informace?) - str. 12: … často s pooling vrstvami (chybí definice, hantýrka) - str. 13: … pokud neurony nesdílí žádné časti zpracovávaných oblastí, mají výstupy nezávislé (to ovšem obecně neplatí vzhledem k závislostem uvnitř obrazu) - str. 14: … váhy…jsou nastavovány tak, aby detekovaly požadované příznaky (co zde znamená požadované?), dále: … kernel (česky - i v matematice - jádro) - str. 15: …počet kanálů obrazu (chybí definice), dále nedefinovaný symbol r - str. 17: …není třeba extrakce příznaků (extrakce pomocí CNN ovšem třeba je, jde o to, že není třeba příznaky explicitně definovat předem) - str. 27: nesouhlasí rozměr filtrů ve vyšších vrstvách podle obr. 5.2 a v následném textu - str. 29: Rychlost učení … (chybí definice, patrně jde o rychlostní koeficient v korekční formuli při iteraci vah) - str. 29 a později: …křížová entropie… (správně vzájemná entropie) - str. 29 a později: klesající popř. rostoucí průběhy v obr. 5.5 a 5.6 (průběhy zřejmě nejsou monotónní, vyjádření se mělo týkat jejich trendů) - str. 32: … ve snímcích detekují různé vzory , které jsou méně citlivé na lokální změny (??) - str. 37: …nabytých anatomický vlastností (co zde znamená nabytých? patrně jde o apriorní znalosti) - str. 44: … 2200 snímků vybraných z validační množiny (jak vybraných a jde vůbec o výběr „z“ nebo spíš „do“?) - str. 63: formulace týkající se „překryvu“ v posledních dvou odstavcích čtenáři neřeknou ani rámcově, o co se jedná (pokud si neprostuduje předem kap. 8.2) . Závěrem konstatuji, že diplomantka nejen splnila zadaný úkol, ale výrazně původní požadavky rozšířila, čímž dosáhla ucelených výsledků. S ohledem na komplexnost problému, zasahujícího do aktuální teoretické oblasti, včetně návaznosti na medicínskou oblast, dále do oblasti náročné počítačové implementace a hodnocení výsledků, navrhuji klasifikaci stupněm A, přičemž vytýkané nedostatky jsou reflektovány bodovým hodnocením 93 bodů.
eVSKP id 110567