NAJBR, F. Klasifikace metagenomických vzorků s využitím číslicového zpracování genomických signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Studen Filip Najbr se ve své práci pokusil o vytvoření nového postupu pro klasifikaci pacientů s diabetem 2. typu na základě jejich metagenomických vzorků. I přes to, že student byl dopředu informován, že se jedná o téma zcela experimentální a bude tudíž náročnější, byla jeho prokázaná snaha v průběhu semestru zcela podprůměrná. Jak je z výsledků práce patrné, studentem navržený postup se nezdá být funkční. Validita těch výsledků je však diskutabilní vzhledem k tomu, že student testoval metodu pouze na 1000 čteních z každého pacienta, což bereme-li v úvahu sekvenaci se ziskem např. 10 milionů čtení, netvoří ani 1 % celého vzorku. Práce s celým výstupem sekvenačního běhu je sice výpočetně náročnější, proto byl student dopředu informován, že bude potřeba naučit se pracovat s výpočetním serverem, což však neučinil. Po formální stránce je práce také podprůměrná, obsahuje překlepy, názvy proměnných v textu nejsou kurzivou, některé věty – především v sekci s výsledky – jsou nesrozumitelné, obrázky jsou často nekvalitní a kolikrát nevhodné velikosti (obrázky v sekci představující navržené příznaky a v sekci s výsledky mají nečitelné popisky os, oproti tomu např. obrázek 16 představující učení neuronu nesmyslně zaujímá celou stranu). Dále běžně není v textu ani v popisku obrázku popsáno, co je na daném obrázku uvedeno. U obrázků 13-16 navíc není uvedeno, odkud byly převzaty, či jakým zdrojem byly inspirovány. Sekce s výsledky zaujímá pouhých 8 stran, a to včetně popisu dat a blokového schématu na celou stranu, které je však dle mého názoru neinformativní a mělo by být zjednodušeno. Sekce s výsledky je celkově velmi nepřehledná a z textu není patrné, pro který z navržených přístupů se autor na základě výsledků rozhodnul v dalším kroku. Většině nedostatků by se šlo vyhnout, pokud by student nenechal práci na poslední chvíli. Ale i přes některé serióznější chyby bylo zadání těsně splněno a navrhuji práci k obhajobě s hodnocením E [53 bodů].
Student Filip Najbr se zabýval možnostmi návrhu a implementace metod strojového učení pro automatickou klasifikaci dat pacientů při onemocnění diabetem mullitu. Text práce je v rozsahu 45 stran bez příloh a obsahuje seznam 21 relevantních odborných pramenů. Po formální stránce práce trpí některými menšími i většími chybami. Například obrázek 16 je poněkud neobvyklým zobrazením struktury neuronové sítě a v podstatě nenaznačuje, že by se jednalo o síť, neboť obsahuje jediný neuron a to ještě v jiném zobrazení než na přesnějším obrázku 13. Bloková struktura programu na obrázku 17 neobsahuje šipky označují tok dat a u některých spojení není jasné, co se s daty děje. Dále je jen zmíněna metoda ICO založená na intrisické korelaci oligonukleotidů a metoda SVM (Support Vector Machine). Obě metody se vyskytují v doporučené literatuře, nicméně jejich formální zpracování v textu není dostatečné a nedává ani základní informaci, jak pracují. Po odborné stránce v práci shledávám zásadní nedostatek, a to ověření metod na příliš malém vzorku dat od jednotlivých subjektů. Chápu, že v rámci standardní bakalářské práce ve zřejmě omezeném čase a přístupu k výkonnému počítači nelze zpracovávat data například v objemu celých genomů, nicméně výběr 1000 náhodných čtení na pacienta je opravdu nevhodně malý. S uvedeným výběrem nelze usuzovat na žádné výsledky, neboť se jedná jen o zlomek dat dostupných ke každému pacientu. Z toho zřejmě vyplývá i informačně poměrně chudá část 5 Results. Ta je navíc psaná velmi stručně na úkor srozumitelnosti. Na druhou stranu implementace metod je správná a při ověření na celém souboru dat by jistě autor obdržel další zajímavé výsledky, které by bylo možné diskutovat. Předloženou práci nicméně hodnotím jako akceptovatelnou i přes uvedené výtky.
eVSKP id 110515