POLZEROVÁ, N. Predikce sekundární struktury RNA [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Studentka Nikola Polzerová vypracovala diplomovou práci na téma predikce sekundární struktury RNA. Studentka se v teoretické části zaměřuje na tradiční výpočetní metody a pak zejména na metody založené na strojovém učení, které se v této oblasti v posledních letech velice často používají. Zaměření diplomové práce je tedy velmi aktuální. Literární rešerše je logicky členěna a podložena celkem 71 literárními zdroji. V praktické části studentka popisuje použitý dataset, proces předzpracování dat, implementaci neuronové sítě, její učení a způsob zpracování výsledků predikce. Během posledního semestru se studentka věnovala zejména předzpracování celého datasetu. Trénování samotné sítě a její optimalizace byla prováděna až v samotném závěru před odevzdáním. Ze zhodnocení výsledků pak vyplývá, že pokud je testovací dataset rozdělen do skupin podle délky sekvencí a pro každou skupinu je vyhodnocena úspěšnost predikce, tak se úspěšnost predikce značně liší. V úvodním popisu datasetu je také zmíněné rozdílné zastoupení sekvencí podle délek. Není mi ale jasné, jaké pak bylo zastoupení sekvencí podle délek v trénovacím, validačním a testovacím datasetu a zda to ovlivnilo výsledek predikce. Po formální stránce bohužel práce obsahuje některé nedostatky, např. chybějící nebo nefunkční křížové odkazy na kapitoly i na literaturu. Na druhou stranu pozitivně hodnotím to, že práce je napsána anglicky, a to velice srozumitelně bez gramatických chyb. Práce splňuje všechny body zadání a vzhledem k výše uvedeným výtkám práci hodnotím stupněm dobře/C (77 bodů).
Studentka Nikola Polzerova se v rámci diplomové práce zabývala studiem predikce sekundární struktury RNA. Samotné zadání práce a studium ve stanovené oblasti je formulováno na vysoké výzkumné úrovni. Celkově je toto téma v nynější době velmi populární ve vědecké oblasti. V teoretické části představuje studentka logicky rozčleněnou problematiku predikce sekundárních struktur RNA a uvádí vhodné příklady strojového učení citované právě s aplikací na predikci sekundárních struktur RNA, které odráží velký potenciál studia v této oblasti. Obsah práce je logicky rozčleněn. V rámci praktické části studentka představuje vhodně zvolený dataset, který je pro trénování a testování predikčních nástrojů sekundární struktury RNA vhodně předzpracován. Předzpracování datasetu je popsáno velmi detailně a srozumitelně, jelikož se jedná o důležitý krok pro výsledné predikce, začátek praktické části je popsán a proveden výborně. Menší zdokonalení bych viděla pouze v tom, kdyby studentka detailněji diskutovala zastoupení délek sekvencí napříč trénovací, testovací a validační množinou použitého datasetu. Na základě prostudované rešerše studentka navrhla neuronovou síť, která je vhodně popsána v teoretické části. Samotná implementace hlubokého učení byla v programovacím jazyku Python. Vytvořené skripty jsou přehledné a s řádnou dokumentací. Vytknout musí ovšem výsledné predikce, které mají pouze zhruba 0,51 F1-Skóre. Tento údaj sám o sobě není vůbec špatný v rámci porovnání s publikačními výsledky v dnešní době v oblasti tohoto výzkum. Nedostatek spatřuji spíše v nedostatečném odůvodnění a porovnání s jinými již dostupnými nástroji, jako je UFold, který je normálně dostupný – i přestože studentka v práci tvrdí opak. S tím souvisí i menší výtka k samotné diskusi k výsledkům, která činí pouze 1,5 stránky. Přes všechny uvedené výtky musím konstatovat, že zadání práce bylo splněno. Navíc, je samotná práce psaná anglickým jazykem, což oceňuji, protože je pro diplomovou práci mnohem vhodnější než jazyk český. Hlavně i z toho důvodu, že je práce takto dostupná pro širší vědeckou komunitu, což spatřuji jako velmi užitečné pro další navazující vědecké práce v této problematice. Práci připouštím k obhajobě a hodnotím stupněm B (80 bodů).
eVSKP id 150859