TALANTBEKOVA, A. Sestavování pan-genomů na základě sekvenční homologie [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Studentka Aizhan Talantbekova se ve své práci zabývá srovnáváním bakteriálních genomů pomocí analýzy jejich pan-genomů, tj. souborem všech genů, které určitá skupina bakterií obsahuje. Literární rešerše shrnuje všechna důležitá fakta o genomech i pan-genomech, jejich strukturní i funkční anotaci a následně i komparativní analýze. Teoretická část práce se pak začíná prolínat s praktickou částí v kapitole popisující jednotlivé nástroje, jelikož studentka jejich popis doplňuje o ukázky jejich výstupů generovaných přímo na vytvořeném testovacím datasetu 10 bakterií. Takový přístup hodnotím velmi pozitivně a je odrazem studentčina aktivního přístupu k řešení práce, kterou průběžně konzultovala a předložila ke kontrole rozpracovanosti. V rámci praktické části pak navrhla a v Pythonu realizovala vlastní nástroj nebo spíše pipeline BPG-SH, která využívá dílčí dostupné nástroje pro pan-genomovou analýzu. Kombinace nástrojů je ale unikátní a přináší původní výsledky. Velmi kladně hodnotím i srovnání navržené pipeline s nástroji již existujícími. Analýza ukázala, že výstupy jednotlivých nástrojů se mohou i podstatně lišit. Bohužel práce pro toto nepřináší jasně definovaný závěr. I tak je ale analýza na poměry bakalářského studia zdařilá. Po formální stránce musím práci vytknout občasné překlepy či zvláštní slovní spojení, toto je ovšem potřeba chápat v kontextu toho, že studentka není rodilou mluvčí. Výtky mám i k některým ilustracím ať už k jejich kvalitě, či umístění, např. v obr 5.1 je nesmyslně pro každý krabicový graf použita jiná osa y, čímž se vizuálně ztrácí informace o rozdílných počtech a rozptylech jednotlivých kategorií pan-genomu. I přes uvedené výtky práci hodnotím jako velmi dobrou a doporučuji ji k obhajobě.
Práci doporučuji k obhajobě a navrhuji hodnocení dobře (C, 70 bodů). Kapitoly věnující se teoretické části práce jsou kvalitně zpracované. Dataset obsahující 10 genomů E. coli je vhodně zvolený a dostatečný, stejně tak testování dostupných nástrojů. Zejména oceňuji jejich srovnání v závěru práce. Praktická část je založena na vytvoření zdrojového kódu v Pythonu s využitím objektového programování. Zpracování je velmi kvalitní a značně přesahuje běžné znalosti studenta bakalářského studia. Kapitola 4 je pojata jako manuál k vytvořenému software a dostupný GitHub adresář obsahuje tutoriál. Pouhým následováním uvedených kroků ale není možné program použít, resp. nainstalovat. V manuálu je první podkapitolou aktivace virtuálního prostředí, které, cituji, "obsahuje všechny potřebné závislosti a nástroje pro spuštění nástroje". Jak se tyto závislosti a nástroje do prostředí dostanou, či jak prostředí vlastně vznikne, zůstává záhadou. V GitHub je sice příkaz pro vytvoření prostředí dostupný, ale chybí informace, že je předtím nutné soubory stáhnout, či manuálně nainstalovat potřebné balíčky. Celkově požadavky zadání hodnotím jako splněné velmi dobře, pokud budou doplněny informace potřebné k praktickému využití nástroje (navrhuji dopsání do GitHub adresáře a zodpovězení dotazu č. 2). Prezentační úroveň a formální úpravy: jako celek je text čitelný a logicky navazující. Výhrady mám následující: literární zdroje nejsou uvedeny popořadě, např. kapitola 1 cituje zdroje v pořadí 2, 5, 6, 12, 10, 13. Dále chybí vysvětlení použitých zkratek přímo v textu, např. WGS v kapitole 1. Text obsahuje překlepy, kterých ale není mnoho. Nadpis 3.2 sestávající z pseudoslova "pipeliny" nelze považovat za chybu, nicméně volba vhodnější fráze, např. "dostupné nástroje" by byla velmi přínosná. Obrázky mají již více nedostatků, jako je nečitelnost textu ve většině z nich. Některé obrázky jsou navíc vloženy do vět. Nejpodstatnější nedostatek vnímám ve vložení několika obrázků do nesouvisejících (navazujících) sekcí. Např. Obr. 3.2 je vložený do podkapitoly 3.2.2, ale popis je obsažený v sekci 3.2.1. Vzhledem k tomu, že tyto sekce obsahují srovnání různých nástrojů, je vkládání obrázků do neodpovídajících sekcí velmi matoucí. Tento aspekt práce hodnotím stupněm dostatečně. Práce s literaturou je na výborné úrovni, v pořádku je i rozsah práce. Využitelnost výsledků považuji za velmi dobrou.
eVSKP id 169330