MATULA, J. Genotypizace u makaků ve výzkumu infekce virem HIV [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.

Posudky

Posudek vedoucího

Sedlář, Karel

Student Jan Matula se ve své práci zabývá návrhem balíčku funkcí pro genotypizaci s využitím unikátních dat MHC a KIR receptorů. Ve své práci nejprve popisuje technologie a techniky sekvenování se zaměřením na amplikonovou sekvenaci a následně shrnuje poznatky z genotypizace ve výzkumu HIV. Rešeršní část práce považuji za zdařilou, je podložena dostatečným množstvím literatury, obsahuje snad pouze jednu vážnější nepřesnost: NCBI či EMBL nejsou databáze, ale instituce spravující různé databáze. Bylo by také vhodnější více využívat převzaté obrázky než pouze svoje vlastní schémata, která jsou někdy nepřesná, např. obrázek 4. V rámci praktické části student navrhl svůj vlastní balíček funkcí, který implementoval včetně nápovědy v jazyce R/Bioconductor. Celý balíček navíc volně zpřístupnil na portálu Github, díky čemuž je snadno instalovatelný jediným příkazem na jakýkoliv počítač. Balíček pak mimo jiné obsahuje zdařilou funkci na automatické vytvoření lokální databáze sekvencí stažením online dat nebo zajímavý hashovací algoritmus pro vyhledávání v databázi. Vyhodnocení funkčnosti algoritmu by ale mohlo být propracovanější, například výpočtem specificity a sensitivity, a ne pouze pomocí vlastního parametru. V tabulkách 9 a 10 pak hodnoty ve sloupcích dopředných a reverzních čtení udávají spíše počty unikátních sekvencí, tedy alel. Vysvětleny by také mohly být některé přednastavené hodnoty funkcí navrženého balíčku. I přes svou stručnost je tato část práce logicky členěna a je přehledná, zadání práce tedy považuji za bezezbytku splněné. Při vypracování práce student sice využíval konzultací spíše sporadicky, práci ovšem předložil pro kontrolu rozpracovanosti a navíc se i zúčastnil studentské soutěže. Po formální stránce je práce také na dobré úrovni, obsahuje pouze minimum překlepů. Celou práci tedy doporučuji k obhajobě a hodnotím jako velmi dobrou.

Navrhovaná známka
B
Body
85

Posudek oponenta

Maděránková, Denisa

Student Jan Matula vypracoval bakalářskou práci na téma „Genotypizace u makaků ve výzkumu infekce virem HIV“. V teoretické části práce se student věnuje jednotlivým sekvenačním technologiím a technikám a dále stručně popisuje genotypizaci ve výzkumu infekce HIV. Tato část práce je zpracována přehledně a kvalitně. Popis vlastního řešení a diskuze výsledků je na 15 stranách textu. Popis řešení je celkem přehledný a dostatečný, avšak doplňující blokové schéma zpracování dat by bylo vhodné. Postrádám vysvětlení některých aspektů práce: v kap. 4.5.2 není zdůvodněno proč se znaky N (neznámý nukleotid) nahrazují pouze znaky A (adenin), není vysvětleno, jak se řeší případný výskyt dalších speciálních znaků; obr. 12 znázorňuje časy hashování a vyhledávání, není uvedeno, na jakém hardwaru to bylo testováno; chybí zdůvodnění nastavení hodnoty prahu pro kondenzaci na 10 a délka k-merů na 7; při vyhledávání metodou SSAHA není zdůvodněno, proč se vypisuje pouze 10 nejlepších výsledků, když se to pak porovnává s BLASTem, který má nastaveno 1000 nejlepších. Dále je navržený parametr DSC příliš jednoduchý a zavádějící, a statistické vyhodnocení je omezeno pouze na výpočet procentuální shody s BLASTem. Student práci uzavírá s tím, že jím použitá metoda SSAHA dosahuje v porovnání s BLASTem 91,87 % průměrnou úspěšnost, ale už nediskutuje proč v některých případech je shoda i výrazně pod 50 %. Po formální stránce je práce na dobré úrovni s malým množstvím gramatických chyb. Některé formální nedostatky: nadpisy kapitol by měly být od předcházejícího textu více odsazeny, font popisků tabulek a obrázků je malý, není vysvětlena zkratka SIV, seznam zkratek není seřazen abecedně, některé obrázky jsou zbytečně velké. I přes uvedené nedostatky jde o hodnotnou práci a studentem vytvořený balíček funkcí může být užiteční pro další práci.

Navrhovaná známka
B
Body
80

Otázky

eVSKP id 102413