ZBOŘILOVÁ, N. Klasifikace organismů na základě nukleotidových četností [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.
Studentka Nicol Zbořilová se ve své práci zaměřila na metody klasifikace nukleotidových sekvencí na základě charakteristických četností nukleotidových slov o různé délce. Vypracovala teoretickou rešerši, kde popisuje obecně klasifikaci biologických sekvencí, moderní metody klasifikace četnostních profilů sekvencí a navrhla klasifikaci na základě výskytu prostých dinukleotidových a tripletových slov. Popsané metody realizovala, testovala na dvou sadách dat a výsledky statisticky srovnala. Problémem celé práce je fakt, že studentka své postupy průběžně nekonzultovala. V textu se proto vzhledem k využití v práci vyskytují nelogické kapitoly, např. Pearsonův korelační koeficient, Typy konsensuálních stromů, Skórovací matice pro aminokyseliny apod. Nedostatky se vyskytují i v praktickém zpracování, kdy metoda klasifikace podle Yanga není správně naprogramována, což dokumentuje i přiložený zdrojový kód, ve kterém je nefunkční část změny délky nukleotidového slova. Mezi další nedostatky patří nedostatečně popsaná a zdůvodněná volba testovacích dat, nedostatečný popis realizace metod klasifikace a chybějící zhodnocení výpočetní náročnosti algoritmů, což je hlavní přednostní těchto metod. V teoretické i praktické části se vyskytují odborné nepřesnosti, jsou to například nesprávný popis verzí algoritmů Clustal pro mnohonásobné zarovnání a slovní zdůvodnění chyb klasifikačních metod. Po formální stránce v práci chybí seznam použitých zkratek a seznam referencí neodpovídá normě. Vzhledem ke zmíněným nedostatkům a nízké aktivitě studentky v průběhu řešení projektu hodnotím práci pouze jako uspokojivou.
Formální stránka bakalářské práce studentky Nicol Zbořilové trpí několika závažnějšími nedostatky - chybí seznam používaných zkratek, výčet citované literatury není dle normy, obrázky v teoretické části práce jsou nízké kvality. V kapitole 3 při výčtu numerických reprezentací by bylo vhodné uvést konkrétní příklad převodů sekvencí, jejich příslušné numerické reprezentace a hodnoty vypočtených parametrů. U uváděných rovnic chybí vysvětlení některých proměnných, a tudíž není možné z uváděného stručného popisu metod provést jejich algoritmizaci. V kapitole 3.5 jsou prezentovány fylogenetické stromy zkonstruované z četností nukleotidů, dinukleotidů a tripletů na souboru dat, o jaká data šlo, se však dovídáme až v kapitole 4.1. Kapitola 4.3 nemá v práci význam. V kapitole 4.4 jsou popsány dva parametry pro vyhodnocování podobností fylogenetických stromů, v práci jsou stromy hodnoceny pouze jedním z uvedených parametrů. V přiloženém programu není funkční volání funkce pro výpočet četnosti dimerů. Funkce pro metodu Yang je naprogramována špatně - místo výpočtu četnosti slov od velikosti 2 až zadaná velikost, dochází opakovaně k výpočtu pro maximální délku slov. Vícenásobné zarovnání 30 kompletních mitochondriálních genomů je na běžném počítači neuskutečnitelné, studentka neuvádí výpočetní parametry použitého počítače a také postrádám alespoň základní vyhodnocení výpočetní náročnosti všech použitých algoritmů, když se studentka v závěru práce odkazuje na větší efektivitu numerických metod oproti vícenásobnému zarovnávání sekvencí. Celková kvalita práce je na nižší úrovni ale akceptovatelná.
eVSKP id 72887