BARILÍKOVÁ, L. Metody zpracování sekvenačních dat technologie Oxford Nanopore pro účely metagenomiky [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Studentka Lujza Barilíková se ve své práci zaměřila na aktuální téma vizualizace metagenomických vzorků pro účel klasifikace sekvencí vyprodukovaných nanopórovou sekvenací. Toto téma je experimentální a autorka se jej zhostila velmi dobře. V první části vypracovala kvalitní literární rešerši na současné sekvenační přístupy a metody vizualizace metagenomických dat. K tomu využila 46 kvalitních převážně zahraničních zdrojů. V praktické části poté vytvořila program v prostředí R pro načtení dat získaných nanopórovou sekvenací a jejich následnou vizualizaci za využití metod redukce dimenzionality. Autorka otestovala celkem 4 různé metody spolu s ověřením vlivu nastavení různých parametrů. K tomu využila simulovaný metagenomický dataset. Velmi pozitivně hodnotím aktivní přístup studentky v průběhu celého roku, kdy navíc předběžné výsledky prezentovala na studentské konferenci EEICT. Celkově je práce po odborné i formální stránce kvalitní a hodnotím ji stupněm A [97 bodů].
Studentka Lujza Barilíková se zabývala vývojem algoritmu pro klasifikaci metagenomických dat získaných sekvenační technologií Oxford Nanopore. Jedná se o nejmodernější a velmi potřebnou problematiku aplikace dosud neexistujících metod pro online získávaná data o bakteriálních (případně jiných) genomech. Text práce je v rozsahu 46 stran plus přílohy a obsahuje seznam 46 zcela relevantních odborných pramenů. Po formální stránce je práce velmi dobře zpracovaná, struktura a úprava textu je plně akceptovatelná. Některé části obsahují překlepy nebo nevhodné formulace („nasekání genomové DNA“, „nejideálnější hodnota“), ale jejich počet je nízký. Chybí definice parametrů OFDEG a frekvence výskytu tetranukleotidů, které jsou jen stručně zmíněny. Po odborné stránce je práce dobře koncipovaná, obsahuje všechny potřebné části. Oceňuji zejména stručný, ale výstižný popis jednotlivých sekvenačních metod a vlastností dat, které poskytují. V kapitole 4 jsou velmi jasným způsobem popsány metody nutné pro efektivní vizualizaci dat. Stěžejní a velmi dobře zpracovaná je kapitola 5 popisující návrh a realizaci metod pro vizualizaci a jejich podrobné testování s nastavováním parametrů. Práce je sice úplná, nicméně bylo by velmi zajímavé doplnit některé části. Například v části 4.3 o metod NMDS by bylo užitečné ukázat její možnosti v konkrétním případě s odhadem tvaru funkce stress, neboť se jedná o optimalizační úlohu s cílem hodnotu stress minimalizovat. V části 4.4 o metodě t-SNE se to autorce podařilo lépe. V části 5.2 autorka tvrdí, že na základě hodnot z FAST5 souborů lze rekonstruovat původní signál ze zařízení MinION, neboť pro každý odlišný úsek signálu známe délku trvání, střední hodnotu a směrodatnou odchylku. Tato úvaha však platí jen pro určité předpokládané rozložení hodnot signálu. Na straně 31 nahoře se poprvé objevuje pojem „perplexity“, který ovšem není definován. Pojem lze použít obecně, zde má však přiřazeny konkrétní hodnoty a bylo by dobré popsat, co hodnoty představují (tedy jaká je jejich spojitost s entropií zvoleného pravděpodobnostního modelu). Předloženou práci nicméně hodnotím velmi pozitivně. Je vidět, že autorka na práci intenzivně pracovala a získané výsledky považuji za užitečné pro odborníky, kteří pracují nebo budou pracovat s moderní technologií Oxford Nanopore.
eVSKP id 110489