KUPKOVÁ, K. Metody rychlého srovnání a identifikace sekvencí v metagenomických datech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Sedlář, Karel

Studentka Kristýna Kupková se ve své diplomové práci zabývala velmi aktuální problematikou rychlé identifikace sekvencí ze shotgun metagenomických dat. Teoretická část práce je podložena množstvím kvalitních referencí a vhodně shrnuje současné metody pro zpracování metagenomických sekvencí a konverze jejich znakového zápisu do podoby genomických signálů. V praktické části studentka navrhla vlastní metodu pro redukci dimenzionality metagenomických dat a jejich následnou vizualizaci ve 3D prostoru s využitím Hjortových deskriptorů. Metoda má pouze lineární časovou složitost a je postavena na deterministickém výpočtu, čímž se značně liší od stávajících metod a přináší tak zásadní průlom v možnostech zpracování metagenomických dat. V rámci kompletní navržené pipeline jsou data ještě následně podrobena automatickému shlukování tak, aby každý shluk reprezentoval sekvence příslušející jednomu organismu a sekvence tak byla identifikována právě příslušností ke shluku. Díky velmi aktivnímu přístupu studentka pro tento účel otestovala velké množství pokročilých metod, přičemž nejlepších výsledků dosáhla při využití metody maximalizace věrohodnosti směsi Gaussovských rozložení. Celá práce je psána anglicky a po formální stránce k ní nemám výhrad. Vzhledem k zásadním poznatkům, které práce přináší na poli bioinformatického zpracování metagenomických dat, práci hodnotím plným počtem bodů.

Navrhovaná známka
A
Body
100

Posudek oponenta

Vítková, Helena

Studentka Kristýna Kupková se ve své diplomové práci zaměřila na zcela novou problematiku využití signálové reprezentace genetické informace pro metagenomickou klasifikaci. K tomuto mezioborovému tématu vypracovala hodnotnou literární rešerši podloženou 53 referencemi z kvalitních zahraničních periodik. Prokázala zajímavý potenciál signálových metod pro zpracování metagenomu a navrhla vlastní přístup pro automatickou analýzu složek metagenomu založený na kombinaci pokročilých metod redukce dimenzionality dat a metod shlukové analýzy. Zvolené metody testuje na třech vhodně sestavených datasetech simulujících vlastnosti reálných mikrobiálních komunit. Vytýkám zde však místy nedostatečné testování a statistické vyhodnocení dílčích metod. Zejména výsledky z obrázků 36 -38 jsou vyhodnoceny jen subjektivně a i závěrečné statistické hodnocení v tabulce 5 je vyhodnoceno jen pro jeden ze tří popsaných datasetů. Po formální i odborné stránce je práce až na drobné formátovací nedostatky na vynikající úrovni. Přes uvedené nedostatky považuji dosažené výsledky za hodnotné a celkově hodnotím práci jako výbornou.

Navrhovaná známka
A
Body
90

Otázky

eVSKP id 93541