NEJEZCHLEBOVÁ, J. Identifikace neznámých bakteriálních genomů pomocí online databázového nástroje [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Studentka Julie Nejezchlebová se ve své diplomové práci zabývá problematikou identifikace neznámých bakteriálních genomů pomocí vlastní implementace online nástroje. Toto téma je významné zejména pro objevování nových bakterií, které mohou mít klíčovou roli například při vývoji nových probiotik. Během teoretické části práce studentka nastudovala základy bakteriální typizace a metody analýzy genomických dat. Studentka tak v práci vhodně popisuje několik algoritmů, včetně hladového algoritmu, heuristického vyhledávání podobných sekvencí, skrytého Markovova modelu, algoritmu mapování bez zarovnání a algoritmu minMLST. V praktické části se studentka soustředí na dataset bakteriálních genomů poskytnutý ve spolupráci s Výzkumným Ústavem Veterinárního Lékařstí (VÚVeL), na které studentka otestovala dostupné nástroje pro bakteriální identifikaci jako jsou BLAST, BLAT, Cd-hit, Barrnap, FastANI a PROKKA. Hlavní část této diplomové práce je věnována vlastní implementaci a testování nástroje ‘Bacterial Explorer‘. V této části práce studentka vhodně prezentuje backend a frontend nástroje společně s jeho následným testováním. Nástroj ‘Bacterial Explorer‘ studentka vytvořila pomocí frameworku Flask pro Python a propojila jej s online databází VÚVeLu pomocí Docker kontejneru. Nástroj slouží k detekci nových bakterií, které nejsou zahrnuty v referenční databázi, a nabízí dvě metody detekce podobných bakterií: první metoda je založena na 16S rRNA, druhá používá celé genomy. Obě tyto metody studentka vhodně konzultovala s mikrobiology v rámci externí spolupráce. V rámci testování byla hodnocena jak uživatelská přívětivost, tak funkčnost nástroje. Studentka se zaměřila na tři hlavní testovací scénáře. Nejprve testuje typizaci bakterií hojně zastoupených v databázi VÚVeLu, dále bakterií s jediným zástupcem v databázi a v neposlední řadě typizaci bakterií, které v databázi nejsou. Výsledky ukázaly, že nástroj ‘Bacterial Explorer‘ je schopen správně identifikovat bakterie jako podobné nebo neznámé s vysokou přesností. Práce bohužel obsahuje pár formálních nepřesností, jako je opakování slova „BLAT“ ve větě několikrát za sebou, nebo neznámého fialového sloupce v obrázku 5.17. Studentka Julie Nejezchlebová pracovala maximálně samostatně a pravidelně konzultovala své výsledky s vedoucí i externími spolupracovníky. Práce tedy dosahuje velice kvalitních výsledků a nástroj, vytvořený studentkou bude nyní aktivně využíván na VÚVeLu. O nadměrné aktivitě studentky svědčí i fakt, že díky výsledkům, kterých dosáhla již během semestrální práce byla zařazena do kolektivu jako spoluautor příspěvku přijatý na mezinárodní konferenci IWBBIO2024 a aktivně se účastnila konference EEICT 2024. Práci doporučuji k obhajobě a hodnotím stupněm výborně A – 96 body.
Studentka Julie Nejezchlebová se ve své diplomové práci věnuje problematice identifikace neznámých bakteriálních genomů prostřednictvím vlastní implementace online nástroje. Práce kombinuje teoretické a praktické aspekty, přičemž klade důraz na vytvoření a testování nového softwarového nástroje. V teoretické části práce se studentka zabývá literární rešerší ohledně fenotypové a genotypové analýzy, které vedou k identifikaci neznámé bakterie, případně k detailnějšímu zařazení bakterie v rámci jednotlivého bakteriálního druhu či poddruhu, tzv. typizaci. V praktické části se pak věnuje vlastní analýze identikikace neznámého genomu a zvláště pak vytvoření nástroje „Bacterial Explorer“. K práci mám několik formálních poznámek. Některé české výrazy (otestovat, rozsekat) není vhodné používat ve odborné práci, dají se nahradit spisovnými a terminologicky správnými výrazy. Podobně slovní spojení „inovativní probiotické metody“ zní velice zvláštně. V práci je zmíněn původ bakterií, jsou to mikrobiota kura domácího a prasete domácího, biologické zástupce vždy uvádíme i latinskými jmény. Bakteriální kmeny/phyla neuvádíme kurzívou ale standardním fontem, ovčí krev se správně nazývá beraní erytrocyty. V části práce, kde popisuje bakteriální sbírku, zmiňujete, že genomy byly sestaveny nástrojem IDBA v1.1.1, ref .č .71, 72, 70. Tento nástroj je již trochu zastaralý, v původní verzi se používal v kombinaci se SSPACE v3.0 (ref 71), v pozdější fázi byly genomy sestaveny znovu pomocí Shovill v.0.9.0, tak jak je zmíněno v publikaci č. 70 z roku 2024. Z popsaných tabulek uvených v části A není zřejmé, co je vstupním souborem. K implementaci nástroje a zvolení vhodných bioinformatických nástrojů nemám žádné připomínky. Naopak mám velmi kritickou poznámku k vyhodnocení výsledků bioinformatické analýzy. Velmi mě překvapilo, že studentka k ověřování výsledků a příbuznosti bakterií nepoužila i přiložený fylogenetický strom. Z publikace č. 70 a dalších studií vyplývá, že stejné bakteriální kmeny/typy sdílejí více než 99 % svého genomu (ANI analýza) a jsou nerozlišitelné na fylogenetickém stromu nebo mají jen velmi malou bifurkaci mezi sebou. Proto mě velmi znepokojuje, že při použití metody 2, celogenomového srovnání, izolát ET32 z Actinobacteriota má velmi podobný genom se zástupcem Elusimicrobiota, takové bakterie spolu nesdílejí téměř žádnou identickou DNA (opět ref. 70). Navíc jste blíže neanalyzovala, proč k tomu došlo a jestli došlo k falešně pozitivním výsledkům v rámci nástroje cd-hit. Všimla jsem si, že v nastavení parametrů pro tento nástroj nemáte nastavený limit pro různou velikost porovnávaných sekvencí. Očekávala bych, že falešně pozitivní výsledky mohou být způsobeny kontaminací, k níž může dojít během laboratorní práce nebo přímo i na sekvenátoru, který není dostatečně přečištěn z minulého běhu. Nicméně minoritní genom nebude zastoupen ve výsledné sekvenci v plné velikosti, a tedy pozitivní výsledek se bude týkat jen malého úseku DNA ve srovnání s velikostí celého genomu. Nebo to může mít úplně jiný důvod. Nicméně, takovéto výsledky je třeba ověřovat a na základě nich měnit parametry bioinformatických nástrojů. Z tohoto důvodu Vám musím konstatovat, že dle mého uvážení práce nesplňuje požadavky na diplomovou práci z bioinformatiku a práci doporučuji k přepracování.
eVSKP id 159761