MAROCHKINA, E. Prediktivní modelování nad medicínskými daty [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Burgetová, Ivana

Aktivitu studentky při řešení bakalářské práce hodnotím jako nadprůměrnou. A i když celá práce byla nakonec dokončována v časové tísni, navrhuji hodnocení stupněm B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jedná se o zadání, které vzniklo ve spolupráci se studentkou, která se chtěla věnovat prediktivním úlohám nad datovou sadou MIMIC-III. Jedná se o velmi rozsáhlou datovou sadu, takže práce s ní byla náročná, ale přesto se studentce podařilo natrénovat poměrně dobré modely. Jednalo se o úkol, který studentku zajímal, a proto jsem byla s její prací spokojena.
Práce s literaturou Studentka si kromě doporučených zdrojů sama vyhledala další potřebné studijní materiály.
Aktivita během řešení, konzultace, komunikace Studentka pracovala na řešení velmi aktivně a samostatně. V zimním semestru řešení pravidelně konzultovala a na konzultace byla vždy dobře připravena. V letním semestru bylo konzultací méně a studentka se zjevně dostávala do časové tísně, protože přípravě dat a vyhodnocení využitelnosti jednotlivých atributů se věnovala velmi podrobně a trvalo to déle, než studentka původně plánovala.
Aktivita při dokončování Technická zpráva byla dokončována v časové tísni, takže se mnou studentka konzultovala pouze část textu.
Publikační činnost, ocenění -
Navrhovaná známka
B
Body
81

Posudek oponenta

Bartík, Vladimír

Práce má jisté nedostatky, které byly zmíněny výše, nicméně studentka splnila zadání a zejména předzpracování vstupního datasetu a provedené experimenty jsou na vysoké úrovni. Hodnotím proto práci stupněm C (dobře).

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Práce se zabývá problematikou získávání znalostí z dat, konkrétně využitím prediktivních modelů v medicínském datasetu. V práci je popsán celý proces od předzpracování k zhodnocení přesnosti predikce. Poté byla vytvořena jednoduchá webová aplikace, která umožňuje spouštění úloh a prezentaci výsledků. Zadání hodnotím jako průměrně obtížné, bylo potřeba se seznámit s oblastí získávání znalostí a provést rozsáhlé experimenty.
Rozsah splnění požadavků zadání Všechny body zadání byly splněny.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 66 Technická zpráva popisuje celý proces získávání znalostí s daným datasetem, a to velmi podrobně. Celkově se mi ale zdá technická zpráva poměrně nevyvážená co se týče rozsahů kapitol. Chybí mi tam teoretický úvod k některým metodám předzpracování, které byly použity, více mohlo být i napsáno o implementaci samotného získávání znalostí v jazyce R i vytvořené webové aplikaci. Srozumitelnosti by prospělo i schéma vstupní databáze. Naopak místy velmi detailní popisy úprav jednotlivých atributů se mi zdály až příliš podrobné, jako čtenář, který daný dataset nezná do hloubky, jsem se v tom ztrácel. Jinak ale zpracování experimentů je na velmi vysoké úrovni a to nejpodstatnější ke všem bodům zadání se v technické zprávě nachází.
Formální úprava technické zprávy 77 Formální úprava práce je na velmi dobré úrovni. Jazyk je bez větších chyb. Typografická stránka je také na dobré úrovni, na pár místech jen přetéká text přes okraj. Místy jsou i krátké kapitoly členěny do zbytečně velkého počtu podkapitol. Jinak zde není co vytknout.
Práce s literaturou 90 Ohledně práce s literaturou neshledávám v práci žádné nedostatky.
Realizační výstup 72 Výsledkem je sada skriptů provádějících jednotlivé kroky získávání znalostí. Byla vytvořena také jednoduchá webová aplikace, která spouští kód v jazyce R a prezentuje získané výsledky. Otázkou je její další využití a rozšiřitelnost o možnost např. analyzovat jiné datasety nebo použít pro predikci jiné modely než byly doposud implementovány.
Využitelnost výsledků Práce představuje ukázku využití predikce smrti a doby přežití v nemocnici. Není zřejmé, zda již někdo stejnou úlohu s tímto datasetem už řešil. Jako ukázku použití prediktivních metod určitě lze aplikaci využít.
Navrhovaná známka
C
Body
70

Otázky

eVSKP id 164271