KREMLIČKOVÁ, L. Klasifikace organismů na základě nukleotidových četností [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.
Studentka Lenka Kremličková se ve své práci zaměřila na alternativní techniky vyhodnocení podobnosti DNA sekvencí bez nutnosti jejich zarovnání. K tématu vypracovala odpovídající literární rešerši. Otestovala možnosti klasifikace sekvencí na základě charakteristických četností výskytu prostých nukleotidových slov. Představila dvě pokročilé metody klasifikace na základě vzdálených dinukleotidů a pořadí výskytu nukleotidových k-tic. Obě metody realizovala v programovém prostředí Matlab a doplnila o uživatelské rozhraní. Navržené metody řádně statisticky testuje a srovnává s klasickou fylogenetickou analýzou i se standardní taxonomií na třech vhodně zvolených setech sekvencí. Na základě získaných výsledků v práci navrhuje i dvě drobné modifikace obou metod pro zlepšení dosažených výsledků. Studentka přistupovala k řešení práce aktivně, výsledky pravidelně konzultovala. Vytýkám jen malou míru samostatnosti a vlastního přístupu k řešení. Po formální stránce je práce až na nižší kvalitu některých obrázků a nejednotnost formátování textu v tabulkách na dobré úrovni.
Studentka Lenka Kremličková vypracovala bakalářskou práci na téma Klasifikace organismů na základě nukleotidových četností. Práce má od úvodu po závěr 37 stran, literárních zdrojů je uvedeno 18, což je na bakalářskou práci dostatečné. Z formálního hlediska bych vytkla neuvedení původu obrázků v teoretické části, tabulka 1 je spíše obrázek ve špatné kvalitě, font používaných proměnných by měl být odlišný od ostatního textu. Výskyt gramatických chyb a překlepů je vcelku malý. Všechny body zadání byly splněny, avšak odborná úroveň zpracování je průměrná. Vlastní programová realizace s analýzou a jejich popis má několik nedostatků. V popisu realizace metod je několik drobných nepřesností. U většiny fylogenetických stromů není v popisku obrázku uveden soubor, z kterého byl strom získán. Odevzdané funkce nelze spustit, neboť jejich souborový název se liší od názvů samotných funkcí. Programové řešení je značně neefektivní. Všechny distanční matice jsou počítány celé, přičemž je to zbytečné, neboť matice jsou symetrické podle diagonály. Dále jsou u metody podle Yanga počítány všechny délky slova, ale uživatel musí nastavit pouze jednu délku, pro kterou se vykreslí strom. Studentka také hodnotí časovou náročnost jednotlivých metod, avšak neuvádí hardwarovou specifikaci. Realizované metody jsou porovnávány s klasickým přístupem založeným na zarovnávání sekvencí, není však uvedeno, jakou metodou byly sekvence zarovnávány a jaké byly použity skórovací parametry. Dále není uvedeno, jaká metoda konstrukce fylogenetického stromu z distančních matic byla používána. Není uvedeno praktické řešení výpočtu Robinsonovy-Fouldovy vzdálenosti mezi stromy. Analýza realizovaných metod však byla provedena na dostatečném množství dat a diskuze výsledků je přijatelná.
eVSKP id 84361