NEJEZCHLEBOVÁ, J. Odvození operonových struktur v rámci celogenomové analýzy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.

Posudky

Posudek vedoucího

Schwarzerová, Jana

Studentka Julie Nejezchlebová se ve své práci věnuje problematice odvození operonových struktur za účelem vytvoření vlastního softwarového nástroje, který umožňuje predikci operonových struktur. V práci nejprve vhodně shrnuje potřebnou teorii související s biologickou interpretací struktury a funkcí transkripčních jednotek. Dále jsou v práci teoreticky popsány sekvenační metody, analýza transkriptomu a dvě bakterie. Jedna bakterie reprezentující modelový organismus Escherichii coli BW25113 a druhá bakterie reprezentující nemodelový organismus Clostridium beijerinckii NRRL B-598, které jsou následně analyzované v praktické části. Celá rešerše obsahuje celkově 57 literárních zdrojů, převážně cizojazyčné literatury. V rámci praktické části studentka otestovala dostupné online nástroje pro odvození operonových struktur a implementovala vlastní softwarový nástroj v jazyce Python . Nástrojem zvládla studentka vylepšit predikci operonů z dostupného online nástroje operon-mapper. Toto vylepšení studentka správně diskutuje v závěru práce, kdy pro srovnání výsledků používá experimentálně ověřené operonové struktury. Práce tedy dosahuje velice kvalitních výsledků, o čemž svědčí i fakt, že za mezi-výsledky své práce prezentované na studentské konferenci EEICT2022 se studentka umístila na druhém místě. Studentka pracovala maximálně samostatně, pravidelně své výsledky konzultovala a při kontrole rozpracovanosti předložila téměř kompletní práci. Díky tomu zvládla studentka v maximální míře odstranit formální nedostatky. Práci proto doporučuji k obhajobě a hodnotím stupněm výborně A – 98 bodů.

Navrhovaná známka
A
Body
98

Posudek oponenta

Jurečková, Kateřina

Studentka Julie Nejezchlebová vypracovala bakalářskou práci na téma odvození operonových struktur v rámci celogenomové analýzy. Studentka vypracovala literární rešerši na téma principy genové exprese u prokaryot se zaměřením pouze na operony a jejich význam v genové regulaci. Následně jsou popsány laboratorní techniky pro studium transkriptomu, které jsou nelogicky rozděleny mezi první dvě kapitoly a vyskytuje se v nich řada nepřesností, zavádějící pojmy nebo některé pojmy nejsou blíže vysvětleny např. pojmy: expresní analýza, automatizovaná exprese, sekvenování s jedním koncem nebo párovým koncem. Literární rešerše je místy povrchní a opírá se o řadu popularizačně naučných webových stránek nikoliv o odborné vědecké články. Řada odstavců je také citována jediným literárním zdrojem. Dále studentka v práci popisuje použitá data, a to data bakterie Escherichia coli BW25113 a Clostridium beijerinckii NRRL B-598. Popis dat působí značně nevyváženě např. studentka uvádí, že genom bakterie E. coli je dostupný pod konkrétním označením v databázi, ale pro tabulku počtu čtení se čtenář pouze dozví, že byla stažena z Gene Expression Omnibus databáze. Dále se zde studentka snaží popsat i experimenty, při kterých byly získány vzorky pro transkriptomickou analýzu. Některé zde uvedené informace jsou špatně, neodpovídají citovaným studiím a pravděpodobně byly „ztraceny v překladu“. Zejména mi pak v práci chybí popis postupu získání tabulky počtu čtení pro E. coli, když celý postup pro C. beijerinckii je v další části podrobně rozebrán. V praktické části je provedeno předzpracování RNA-Seq dat C. beijerinckii, dále je zahrnut popis online nástrojů pro predikci operonů a popis výsledků predikce pro vybrané bakterie. V práci chybí zdůvodnění, proč byl nástroj Operon-mapper použit pro obě bakterie, nástroj FGENESB jen pro C. beijerinckii a databáze ProOpDB nebyla použita vůbec. Vlastní přínos práce spočívá zejména v algoritmu pro predikci operonů na základě již predikované operonové struktury a/nebo na základě genové exprese. Samotný algoritmus využívá pro predikci operonů výpočet Pearsonova korelačního koeficientu a je v práci dostatečně popsán a také znázorněn na vývojových diagramech. V popisu algoritmu mi ale chybí vysvětlení nastavování prahové hodnoty korelačního koeficientu pro predikci operonů. Dále mi není jasné, jakou strukturu by měla mít vstupní data získaná z online nástrojů a jak vhodné struktury docílit. V práci je zmíněno, že by soubor měl být ve formátu xlsx a měl by mít dva sloupce s označením genu a s označení operonu. Výstupní data z online nástrojů takovou strukturu nemají a pravděpodobně si tedy uživatel musí provést předzpracování těchto dat sám. V poslední části práce je blíže popsána a diskutována genová exprese dvou známých operonu, které se vyskytují u analyzovaných bakterií. U obou operonů studentka často uvádí, že geny spolu korelují/nekorelují nebo korelují o něco méně, což pravděpodobně usuzuje pouze vizuálně z heatmapy nebo bodového grafu počtu čtení. Zde bych přivítala i konkrétní vypočítané korelační matice, podle kterých by šlo závislost jednoznačně určit. Zavádějící je pak zejména vyhodnocování a porovnávání hodnot genové exprese u C. beijerinckii, protože data nejsou normalizována a nelze tedy hodnoty genové exprese přímo porovnávat. Po formální stránce je práce ovšem na dobré úrovni a obsahuje pouze minimum překlepů. I přes uvedené výtky považuji práci za zdařilou, zadání práce za beze zbytku splněné a celkově ji hodnotím stupněm C (78 bodů).

Navrhovaná známka
C
Body
78

Otázky

eVSKP id 142076