KOŠÍČEK, A. Využití numerických reprezentací ve zpracování nukleotidových sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.
Práce se věnuje popisu grafických a numerických reprezentací, které se využívají v bioinformatice pro zpracování DNA sekvence. V programovém prostředí Matlab vytvořil student program s GUI pro převedení DNA sekvence do křivky šesti různými metodami. Program dále umožňuje vzájemné porovnání DNA sekvencí a vykreslení jejich vzájemné podobnosti formou dendrogramu. Student přistupoval k řešení aktivně a samostatně, pravidelně využíval konzultací. Při porovnávání DNA sekvencí v grafické formě student z vlastní invence vyzkoušel i další porovnávací kritéria, než kritéria uvedená v literatuře. V teoretické části práce mám výtku k některým formulacím, které vznikly pravděpodobně při překladu anglického textu. Závěrem konstatuji, že student splnil zadání v plném rozsahu.
Formální stránka práce je na dobré úrovni. Úvod práce je pouhým výčtem obsahu jednotlivých kapitol. Student pojal teoretickou rešerši dosti široce, bohužel tím utrpěla srozumitelnost textu, popis metod v kapitole 3 je značně povrchní a celá tato kapitola mohla být vynechána. Zde popisované metody nebyly dále nijak využity. Metody v kapitole 4 jsou popsány oproti předešlým již dostatečně a srozumitelně. Student opakovaně uvádí, že k vícenásobnému zarovnání sekvencí použil metodu Jukes-Cantor, což je ale použitý evoluční model. Naprogramované funkce jsou v pořádku, nedostatek vidím v používání funkce genbankread, která bývá v načítání gb souborů nespolehlivá, FASTA soubory by byly pro tuto práci vhodnější. Funkce pro metodu Liao 1 používá jiný výpočet y-souřadnice, než jak je uvedeno v práci. Z práce nevyplývá z jakého důvodu je možné načtené sekvence ořezávat a především zde není popsán způsob vyhodnocování přesnosti dendrogramů. Postrádám souhrnné vyhodnocení nějakým kvalitativním či kvantitativním parametrem pro všechny metody numerických reprezentací a použitých metrik. Pouhý výčet umístění některých bakterií v dendrogramu je nedostatečný. Výsledky práce ukázaly, že použité grafické metody nejsou vhodné k porovnávání sekvencí. Testování však bylo provedeno pouze na deseti 16S rRNA sekvencích bakterií osmi různých řádů, což není vhodně zvolený soubor testovacích dat. Přes uvedené výtky je práce akceptovatelná a zadání bylo splněno.
eVSKP id 72829