TALIÁNOVÁ, E. Vývoj postupu pro MLST typování Treponema pallidum subsp. pallidum [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Posudky

Posudek vedoucího

Čejková, Darina

Posudek diplomové práce Diplomová práce navazuje na dřívější verzi předloženou v loňském roce a představuje její vylepšenou a rozšířenou podobu. Práce čtenáře seznamuje se základními biologickými a epidemiologickými informacemi o původci syfilis – Treponema pallidum subsp. pallidum, metodami multilokusového sekvenčního typování (MLST) a současnými možnostmi sekvenačních technik. V praktické části je podrobně rozpracován návrh vlastního algoritmu určeného k efektivnímu zpracování dat i pro pracovníky s pouze základními znalostmi bioinformatiky a práce v prostředí Linux. Praktická část práce aplikuje navržený postup na 50 vzorků dostupných v databázi SRA. Je důležité zdůraznit, že T. pallidum nelze rutinně kultivovat, a proto se i při použití pokročilých metod extrakce DNA (např. cílené hybridizace) ve vzorcích běžně vyskytuje směs DNA různých mikroorganismů, což komplikuje následnou analýzu. Tato specifika studentka správně reflektuje při návrhu pracovního postupu. Zpracování dat probíhalo standardně: kontrola kvality, ořez čtení, opětovná kontrola kvality a odstranění kontaminant. Navržený algoritmus dále využívá dvě hlavní strategie: (i) identifikaci známých alel mapováním k databázi pomocí nástroje KMA, (ii) detekci neznámých alel sestavením konsensuální sekvence s využitím SPAdes a její následné porovnání pomocí BLASTu. Studentka konzultovala své kroky pravidelně s vedoucí a konzultantkou práce, nicméně psaná forma práce vznikala se zpožděním a v některých pasážích působí méně uceleně. Výsledky analýzy ukazují, že přístup kombinující mapování pomocí BWA a porovnání konsensuálních sekvencí pomocí BLASTu poskytl robustnější výsledky než samotné použití KMA. Algoritmus KMA často nedokázal správně rozlišit velmi blízké alely kvůli malým rozdílům mezi k-mery, což vedlo k chybnému přiřazení. Mapování pomocí BWA bylo obecně spolehlivější, ale i zde došlo v několika případech k určení více alel se stejnou mírou shody. Práce jako celek je obhajitelná. Přestože v některých částech postrádá hlubší diskusi nebo metodologickou ucelenost, přináší funkční návrh algoritmu a praktickou aplikaci na reálných datech, což je přínosné. Vzhledem ke kvalitě provedení, přístupu studentky a míře samostatnosti navrhuji hodnocení: 83 bodů.

Navrhovaná známka
B
Body
83

Posudek oponenta

Vítková, Helena

Předložená diplomová práce studentky Elišky Taliánové se zaměřuje na sestavení výpočetního postupu pro MLST typizaci bakterie Treponema pallidum subsp. pallidum na základě surových sekvenačních dat z databáze. Teoretická část práce je rozsahově přiměřená, přehledná a podložená dostatečným množstvím převážně zahraničních literárních zdrojů. Po odborné ani formální stránce nemám k této části žádné výhrady. Praktická část práce vychází z vhodně navržené typizační pipeliny doplněné i alternativním algoritmem typizace pro problematické případy. Navrženou pipelinu testuje na 3 datasetech z databáze SRA. Ačkoliv typizace prvního datasetu vychází velmi dobře u druhých dvou datasetů navržený přístup poměrně selhává. V diskuzi studentka tato selhání zdůvodňuje velmi obecně. Jako jednu z hlavních příčin uvádí nedostatečnost analyzovaných datasetů, ale vzhledem k tomu, že původní typizace zřejmě vycházela ze stejných datasetů, hledala bych příčinu v samotném předzpracování dat. Uvítala bych zde ukázku zarovnání sekvenčních čtení ke správné a špatné alele a ověření zda chybovost je způsobena některým z obecně uváděných problému jako nejednoznačnými pozicemi, chybějícími segmenty, nízkou kvalitou bází, výskytem heterogenních alel apod. Navržený alternativní přístup typizace na základě de novo sestavování nabízí zřejmě vyšší správnost určení alely, avšak z časových důvodů nebyl v práci podrobněji testován a optimalizován. Těžko pochopitelná interpretace výsledků, kdy např. správnost nebo chybovost detekce zjistíte jen po zdlouhavém přepínání do příloh práce, nebo procento z určené alely jasně neříká, zda jde o pokrytí mapování či výskyt mutací, taky nepřispívá k věrohodnosti výsledků. V praktické části se vyskytují i drobné formální chyby např. nevysvětlená bílá místa v obrázcích 7.7 a 7.8. Pro uvedené nedostatky v praktické části hodnotím práci celkově jen jako dobrou, stupněm C a 78 body.

Navrhovaná známka
C
Body
78

Otázky

eVSKP id 167588