NYKRÝNOVÁ, M. Metody predikce genů v prokaryotických genomech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.
Předložená bakalářská práce je vypracována na 26 stranách textu od úvodu po závěr, přičemž popis vlastního řešení a výsledků práce zaujímá 11 stran a další 3 strany příloh. Po formální stránce je práce na opravdu dobré úrovni. Práce obsahuje celkem 15 odkazů na literární zdroje, přičemž jde převážně o odbornou cizojazyčnou literaturu. Při řešení práce projevila studentka vlastní iniciativu a pracovala převážně samostatně. Text práce je dobře strukturovaný, popis programů pro predikci prokaryotních genů je kvalitně zpracován stejně jako popis testování programů a realizace vlastního algoritmu a jeho testování. Ačkoliv vytvořený nástroj nedosahuje míry úspěšnosti jako jiné podstatně sofistikovanější nástroje, na bakalářské úrovni jde o hodnotnou práci. Zadání práce bylo bezezbytku splněno a práci hodnotím 95 body.
Studentka Markéta Nykrýnová se ve své práci zabývá metodami predikce genů, což je oblast bioinformatiky, ve které probíhá velmi kompetitivní výzkum a současné algoritmy, které jsou v praxi využívané, jsou velmi pokročilé. Na začátek proto musím podotknout, že zadané téma je na bakalářskou práci podle mě velmi náročné. Při popisu existujícího software, tak studentka musela nastudovat netriviální popis matematického aparátu skrytých markovských modelů, který stojí za dvěma ze tří popsaných nástrojů. To se jí povedlo do větší míry, než bych na bakalářském stupni očekával a teoretická část práce tak působí velmi dobře. V praktické části studentka tři popsané nástroje vyzkoušela a navrhla a realizovala vlastní přístup, který následně také otestovala. Jeden z testovaných parametrů „balanced accuracy“ označuje nesprávně jako přesnost, nicméně toto tvrzení má podloženo citací, ve které je tento parametr opravdu takto chybně označen, jedná se tedy spíše o formální chybu. Navržený přístup nedosahuje tak dobrých výsledků jako další testovaný software, je ovšem nutné přihlédnout k tomu, že testované nástroje byly vytvořeny velkými týmy špičkových vědců. Po odborné stránce tedy i tak působí práce dobře, byť by bylo vhodné algoritmus otestovat na větším množství odlišných organismů, a to především i na organismech z domény Archea. Věřím, že by to pomohlo rozšířit diskusi výsledků, která je poměrně krátká. Připomínku pak ještě musím mít k samotné implementaci navržené metody v prostředí Matlab, kdy studentka plně nevyužila vektorizaci kódu, kterou toto prostředí nabízí. Při nahrazení forcyklů v dílčích funkcích pro nalezení začátků a konců ORF by pravděpodobně bylo možné program znatelně zrychlit. Výstup by mohl být doplněn ještě o možnost gff souboru, který by šlo použít pro prezentaci výsledků v genome brosweru, i tak je ale poskytnutý výstup lepší než u testovaných nástrojů, kde je parsing důležitých informací opravdu zbytečně složitý ve srovnání s navrženým programem. Po formální stránce je práce na vynikající úrovni, obsahuje pouze pár překlepů a vstupy a výstupy ve vývojovém diagramu nejsou znázorněny rovnoběžníky. Zadání práce považuji za bezezbytku splněné a práci, kterou hodnotím s ohledem na náročnost tématu jako velmi dobrou až výbornou, doporučuji k obhajobě.
eVSKP id 93500