NEJEZCHLEBOVÁ, J. Odvození operonových struktur v rámci celogenomové analýzy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.
Studentka Julie Nejezchlebová se ve své práci věnuje problematice odvození operonových struktur za účelem vytvoření vlastního softwarového nástroje, který umožňuje predikci operonových struktur. V práci nejprve vhodně shrnuje potřebnou teorii související s biologickou interpretací struktury a funkcí transkripčních jednotek. Dále jsou v práci teoreticky popsány sekvenační metody, analýza transkriptomu a dvě bakterie. Jedna bakterie reprezentující modelový organismus Escherichii coli BW25113 a druhá bakterie reprezentující nemodelový organismus Clostridium beijerinckii NRRL B-598, které jsou následně analyzované v praktické části. Celá rešerše obsahuje celkově 57 literárních zdrojů, převážně cizojazyčné literatury. V rámci praktické části studentka otestovala dostupné online nástroje pro odvození operonových struktur a implementovala vlastní softwarový nástroj v jazyce Python . Nástrojem zvládla studentka vylepšit predikci operonů z dostupného online nástroje operon-mapper. Toto vylepšení studentka správně diskutuje v závěru práce, kdy pro srovnání výsledků používá experimentálně ověřené operonové struktury. Práce tedy dosahuje velice kvalitních výsledků, o čemž svědčí i fakt, že za mezi-výsledky své práce prezentované na studentské konferenci EEICT2022 se studentka umístila na druhém místě. Studentka pracovala maximálně samostatně, pravidelně své výsledky konzultovala a při kontrole rozpracovanosti předložila téměř kompletní práci. Díky tomu zvládla studentka v maximální míře odstranit formální nedostatky. Práci proto doporučuji k obhajobě a hodnotím stupněm výborně A – 98 bodů.
Studentka Julie Nejezchlebová vypracovala bakalářskou práci na téma odvození operonových struktur v rámci celogenomové analýzy. Studentka vypracovala literární rešerši na téma principy genové exprese u prokaryot se zaměřením pouze na operony a jejich význam v genové regulaci. Následně jsou popsány laboratorní techniky pro studium transkriptomu, které jsou nelogicky rozděleny mezi první dvě kapitoly a vyskytuje se v nich řada nepřesností, zavádějící pojmy nebo některé pojmy nejsou blíže vysvětleny např. pojmy: expresní analýza, automatizovaná exprese, sekvenování s jedním koncem nebo párovým koncem. Literární rešerše je místy povrchní a opírá se o řadu popularizačně naučných webových stránek nikoliv o odborné vědecké články. Řada odstavců je také citována jediným literárním zdrojem. Dále studentka v práci popisuje použitá data, a to data bakterie Escherichia coli BW25113 a Clostridium beijerinckii NRRL B-598. Popis dat působí značně nevyváženě např. studentka uvádí, že genom bakterie E. coli je dostupný pod konkrétním označením v databázi, ale pro tabulku počtu čtení se čtenář pouze dozví, že byla stažena z Gene Expression Omnibus databáze. Dále se zde studentka snaží popsat i experimenty, při kterých byly získány vzorky pro transkriptomickou analýzu. Některé zde uvedené informace jsou špatně, neodpovídají citovaným studiím a pravděpodobně byly „ztraceny v překladu“. Zejména mi pak v práci chybí popis postupu získání tabulky počtu čtení pro E. coli, když celý postup pro C. beijerinckii je v další části podrobně rozebrán. V praktické části je provedeno předzpracování RNA-Seq dat C. beijerinckii, dále je zahrnut popis online nástrojů pro predikci operonů a popis výsledků predikce pro vybrané bakterie. V práci chybí zdůvodnění, proč byl nástroj Operon-mapper použit pro obě bakterie, nástroj FGENESB jen pro C. beijerinckii a databáze ProOpDB nebyla použita vůbec. Vlastní přínos práce spočívá zejména v algoritmu pro predikci operonů na základě již predikované operonové struktury a/nebo na základě genové exprese. Samotný algoritmus využívá pro predikci operonů výpočet Pearsonova korelačního koeficientu a je v práci dostatečně popsán a také znázorněn na vývojových diagramech. V popisu algoritmu mi ale chybí vysvětlení nastavování prahové hodnoty korelačního koeficientu pro predikci operonů. Dále mi není jasné, jakou strukturu by měla mít vstupní data získaná z online nástrojů a jak vhodné struktury docílit. V práci je zmíněno, že by soubor měl být ve formátu xlsx a měl by mít dva sloupce s označením genu a s označení operonu. Výstupní data z online nástrojů takovou strukturu nemají a pravděpodobně si tedy uživatel musí provést předzpracování těchto dat sám. V poslední části práce je blíže popsána a diskutována genová exprese dvou známých operonu, které se vyskytují u analyzovaných bakterií. U obou operonů studentka často uvádí, že geny spolu korelují/nekorelují nebo korelují o něco méně, což pravděpodobně usuzuje pouze vizuálně z heatmapy nebo bodového grafu počtu čtení. Zde bych přivítala i konkrétní vypočítané korelační matice, podle kterých by šlo závislost jednoznačně určit. Zavádějící je pak zejména vyhodnocování a porovnávání hodnot genové exprese u C. beijerinckii, protože data nejsou normalizována a nelze tedy hodnoty genové exprese přímo porovnávat. Po formální stránce je práce ovšem na dobré úrovni a obsahuje pouze minimum překlepů. I přes uvedené výtky považuji práci za zdařilou, zadání práce za beze zbytku splněné a celkově ji hodnotím stupněm C (78 bodů).
eVSKP id 142076