KOŠÍČEK, A. Využití numerických reprezentací ve zpracování nukleotidových sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.

Posudky

Posudek vedoucího

Kubicová, Vladimíra

Práce se věnuje popisu grafických a numerických reprezentací, které se využívají v bioinformatice pro zpracování DNA sekvence. V programovém prostředí Matlab vytvořil student program s GUI pro převedení DNA sekvence do křivky šesti různými metodami. Program dále umožňuje vzájemné porovnání DNA sekvencí a vykreslení jejich vzájemné podobnosti formou dendrogramu. Student přistupoval k řešení aktivně a samostatně, pravidelně využíval konzultací. Při porovnávání DNA sekvencí v grafické formě student z vlastní invence vyzkoušel i další porovnávací kritéria, než kritéria uvedená v literatuře. V teoretické části práce mám výtku k některým formulacím, které vznikly pravděpodobně při překladu anglického textu. Závěrem konstatuji, že student splnil zadání v plném rozsahu.

Navrhovaná známka
B
Body
85

Posudek oponenta

Maděránková, Denisa

Formální stránka práce je na dobré úrovni. Úvod práce je pouhým výčtem obsahu jednotlivých kapitol. Student pojal teoretickou rešerši dosti široce, bohužel tím utrpěla srozumitelnost textu, popis metod v kapitole 3 je značně povrchní a celá tato kapitola mohla být vynechána. Zde popisované metody nebyly dále nijak využity. Metody v kapitole 4 jsou popsány oproti předešlým již dostatečně a srozumitelně. Student opakovaně uvádí, že k vícenásobnému zarovnání sekvencí použil metodu Jukes-Cantor, což je ale použitý evoluční model. Naprogramované funkce jsou v pořádku, nedostatek vidím v používání funkce genbankread, která bývá v načítání gb souborů nespolehlivá, FASTA soubory by byly pro tuto práci vhodnější. Funkce pro metodu Liao 1 používá jiný výpočet y-souřadnice, než jak je uvedeno v práci. Z práce nevyplývá z jakého důvodu je možné načtené sekvence ořezávat a především zde není popsán způsob vyhodnocování přesnosti dendrogramů. Postrádám souhrnné vyhodnocení nějakým kvalitativním či kvantitativním parametrem pro všechny metody numerických reprezentací a použitých metrik. Pouhý výčet umístění některých bakterií v dendrogramu je nedostatečný. Výsledky práce ukázaly, že použité grafické metody nejsou vhodné k porovnávání sekvencí. Testování však bylo provedeno pouze na deseti 16S rRNA sekvencích bakterií osmi různých řádů, což není vhodně zvolený soubor testovacích dat. Přes uvedené výtky je práce akceptovatelná a zadání bylo splněno.

Navrhovaná známka
C
Body
75

Otázky

eVSKP id 72829