TALIÁNOVÁ, E. Vývoj postupu pro MLST typování Treponema pallidum subsp. pallidum [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Čejková, Darina

Diplomová práce Elišky Taliánové se zabývá návrhem MLST typizace Treponemy pallidum subsp. pallidum. Teoretická část práce seznamuje čtenáře se základními údaji o původci syfilis, Treponema pallidum subsp. pallidum, MLST typováním klinických vzorků a současných sekvenačních technikách. Druhá část práce seznamuje s dostupnými bioinformatickými nástroji a poslední část se týká návrhu algoritmů. Diplomová práce byla zamýšlena na zpracování všech dostupných sekvenačních dat během krátkého časového úseku. V současné době je v databázi přes 2000 sekvenačních dat z různých sekvenačních platforem. Nabízené řešení je časově náročné a navíc jej lze těžko zopakovat, protože studentka neuvádí verze ani parametry použití bioinformatických nástrojů. Bod 6, tvorba de novo assembly nových alel, by mohl být nahrazen určením konsenzuální sekvence na základě mapování, nicméně studentka vůbec nepočítala s tím, že kromě záměn se mohou vyskytovat i inzerce či delece, dokonce se mohou vyskytovat u jednoho vzorku od jednoho pacienta. Dle mého zadání není splněno, studentka své postupy během přípravy práce příliš nekonzultovala. Práci tedy hodnotím jako nesplněnou.

Navrhovaná známka
F
Body
35

Posudek oponenta

Jakubíčková, Markéta

Diplomová práce Elišky Taliánové se zabývá návrhem MLST typizace Treponemy pallidum subsp. pallidum. Teoretická části práce je špatně rozvržená, kapitola Sekvenace je zbytečně obsáhlá, naopak kapitola Typování, která je stěžejní pro práci, by měla být rozšířena. Praktickou část práce považuji za nevyhovující. Navržený postup včetně implementace obsahuje zásadní nedostatky a chyby. Rozdělení dat na menší soubory je nesmyslné, způsob, jakým probíhala kontrola sekvenačních dat, je nejasný. Zpracovávané sekvence nejsou dobře popsané; není jasné, co je v jednotlivých případech referenční sekvence, zda se pracuje se sekvencí genomu či genu či jednotlivými alelami. Extrakce čtení odpovídající specifickým genům pomocí BLASTu a jejich zpětné mapování na genom nedává smysl. Navíc pro každý gen je extrahováno pouze 5 – 10 čtení, což je naprosto nedostačující. Tvorba konsensů genů, které jsou pak použity pro typizaci, je špatně udělaná (př. TP0705 má fixní délku 732 bp, studentka má konsensus ve všech případech o 1000 bp delší), tudíž nemůže správně fungovat ani následná identifikace alel jednotlivých genů (jak je vidět v tabulce 6.2). Studentka v práci píše, že tento postup zpracování dat navrhla kvůli nedostačující výpočetní kapacitě použitého počítače, ale neuvádí jeho parametry. Navíc z ukázky kódu 5.3 je patrné, že studentka měla přístup k bioinformatickému výpočetnímu serveru, který by tyto výpočty bez problémů zvládnul. Ve vložených kódech v praktické části se vyskytují chyby. Chybí verze používaných nástrojů a informace o tom, s jakým nastavením byly spuštěny. Bod 6 ze zadání (Zařaďte do postupu de novo assemblování pro identifikaci nových alel.) se v práci nenachází a není tedy splněn. Práce obsahuje i formální nedostatky (nízká kvalita obrázků, popisy obrázků v angličtině, nejednotný styl citací, zkratky nejsou vysvětleny u prvního výskytu). V celé práci se nachází velké množství překlepů a často chybí interpunkce. Z výše uvedených důvodu hodnotím práci jako nedostatečnou – F/35 bodů.

Navrhovaná známka
F
Body
35

Otázky

eVSKP id 159824