GÁLÍK, P. Implementace modelu hlubokého učení pro segmentaci páteřních nádorů u pacientů s mnohočetným myelomem v CT datech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Nohel, Michal

Předložená práce studenta Pavla Gálíka se zabývá implementací modelu hlubokého učení pro segmentaci páteřních nádorů u pacientů s mnohočetným myelomem v CT datech. Práce má logickou strukturu, je napsána na zhruba 45 stranách od úvodu po závěr a cituje celkem 31 položek literatury. V teoretické části se student věnuje popisu onemocnění mnohočetný myelom, popisuje princip dual-energy CT včetně získávání různých parametrických map a základní principy konvolučních neuronových sítí. Dále student vypracoval literární rešerši publikovaných metod strojového učení se zaměřením na segmentaci nádorů. Tuto část považuji za stěžejní a vcelku povedenou. V praktické části práce se student seznámil s dostupnými daty a pro segmentaci lytických lézí zvolil metodu hlubokého učení nnU-Net. Student připravil celkem 12 databází, které obsahují různé kombinace vstupních parametrických map (konvenční CT, VMI na 40 keV, Calcium suppress s indexem 25). Šest databází obsahuje pouze pacienty s lézemi a šest databází je rozšířených o pacienty bez patologií v páteři. Student natrénoval jednotlivé modely a provedl jejich srovnání. Dále provedl analýzu modelů na zvolených částech páteře. Pro přístup k datům si musel student domluvit a absolvovat týdenní stáž ve FNB, kde pomáhal se získáváním dat pro tvorbu databáze. Bohužel došlo k časovému prodlení při anotaci dat ze strany klinického pracoviště, což student nemohl ovlivnit. Práce tak byla vypracována především v posledním měsíci a student pracoval jen s omezeným datasetem 10 pacientů s označenými lézemi. Celkově student pracoval samostatně, byl aktivní a na konzultace chodil pravidelně, nicméně samotný text práce sepisoval v časové tísni. Předložená práce splňuje zadání, ale v některých bodech mohla být provedena hlubší analýza a podrobnější diskuse dosažených výsledků. Práci mohu doporučit k obhajobě, výsledné hodnocení navrhuji uspokojivě (D – 60 bodů).

Navrhovaná známka
D
Body
60

Posudek oponenta

Chmelík, Jiří

Student se ve své práci měl zabývat implementací modelu strojového učení pro segmentaci nádorových ložisek v trabekulárních částech páteře v CT datech u pacientů s mnohočetným myelomem. První část práce se zabývá popisem anatomie páteře, samotným onemocněním mnohočetným myelomem, popisem principů výpočetní tomografie a teorií konvolučních neuronových sítí. Tyto kapitoly jsou zbytečně rozsáhlé a přímo nesouvisí se samotným cílem diplomové práce. Následuje kapitola literární rešerše, která je na dobré úrovni, avšak student často zaměňuje U-Net a nnU-Net. V praktické části student na základě provedené rešerše zvolil pro řešení zadaní vhodný framework nnU-Net, avšak bohužel bez jakéhokoliv zdůvodnění jeho výběru oproti ostatním možnostem. Dále student popisuje použitý dataset, avšak z textu není jasné, jak moc (a zda vůbec) sám přispěl k jeho tvorbě nebo přípravě. Následuje popis předzpracování dat, který je svým obsahem rozložen na celkem jednu stranu textu; zde je nastíněno bez jakéhokoliv detailního vysvětlení nebo zdůvodnění, že bylo naučeno 12 různých modelů, opět však není jasné, jaká část je studentův vlastní přínos. Žádný studentem odevzdaný kód neobsahuje části implementace, učení, vybavení nebo jiné použití těchto zmíněných modelů. Toto je dostupné až v přílohách práce, kde je možné stáhnout naučené modely a skripty k jejich spuštění. Na přílohy však v textu není uveden odkaz. Navíc mám vážné podezření, že tyto skripty nejsou studentovou vlastní prací, ale pocházejí z nijak necitovaného nebo odkazovaného repozitáře https://github.com/tomasvicar/nnunet_metacentrum_example, jehož jsem spoluautorem. Odevzdané soubory také obsahují klon repozitáře nnU-Netu, místo odkazu na jeho původní zdroj. Pokud zde student provedl nějaké modifikace, tak to není zřejmé ani ze zdrojových kódů a ani z textu práce. Jediné odevzdané zdrojové kódy řeší pouze přeukládání dat a jejich ořezání na anatomické struktury zájmu a výpočet evaluačních metrik. Poté již následuje kapitola výsledků, kde jsou popsány tři metriky, opět bez dalšího zdůvodnění jejich výběru nebo vhodnosti. Samotné vyhodnocení výsledků je velmi povrchní bez hlubší diskuse – obsahuje v podstatě pouze přehledy průměrných hodnot některých metrik bez dalšího statistického vyhodnocení. Popis i prezentace výsledků nejsou přehledné a volba jednotlivých experimentů není zdůvodněna; není tak jasné, za jakým účelem jsou které výsledky vypočítány. Kapitola diskuse obsahuje jen celkové shrnutí práce a další výsledky bez jejich další diskuse. V práci postrádám jakoukoliv hlubší analýzu vlivu použitých vstupních dat na výslednou segmentaci. Po formální stránce je práce na dobré úrovni, nicméně mám připomínky k nedostatečným popisům obrázků a tabulek a občasným překlepům. Student používal relevantní literaturu včetně zahraničních zdrojů. Závěrem konstatuji, že i když student musel řešení práce věnovat značné úsilí a strojového času, nepovažuji bod zadání 4) za splněný, protože implementace učení modelů v textu práce zcela chybí. Cílem tohoto bodu zadání bylo také vytvořit ucelený automatizovaný proces, umožňující zpracování dat od jejich načtení až po uložení. Zdrojový kód, který by toto umožňoval nebyl odevzdán. Text práce a zejména jeho praktická část působí nedokončeným a zmateným dojmeme, a vypadá jako by byl tvořen v časové tísni. Závažné nedostatky práce: 1) nesplnění bodu zadání 4) – chybějící popis implementace v textu práce a chybějící zdrojové kódy, 2) plagiátorství – použití cizích zdrojových kódu bez jejich řádné citace a bez respektování licenčních podmínek, 3) zmatečné kapitoly výsledků a diskuse bez jasně definovaných cílů a logických návrhů experimentů vedoucích k jejich řešení, 4) nezdůvodněné volby použitých nástrojů a evaluačních metrik, 5) a nejasný přínos studenta v rámci přípravy použitého datasetu. Vzhledem k uvedeným závažným nedostatkům práci hodnotím stupněm F a doporučuji k dopracování (25 bodů).

Navrhovaná známka
F
Body
25

Otázky

eVSKP id 159779