JANIGOVÁ, P. Identifikace a analýza potenciálně koregulovaných genů v Arabidopsis thaliana [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Schwarzerová, Jana

Studentka Patrícia Janigová ve své bakalářské práci excelentně zpracovala komplexní analýzu regulonových struktur v modelovém organismu Arabidopsis thaliana, přičemž se důkladně věnovala jak teoretickým, tak praktickým aspektům dané problematiky. Práce nabízí solidní teoretický základ pro pochopení regulace genové exprese, se zvláštním důrazem na transkripční jednotky. Studentka prokázala hluboké porozumění moderním sekvenačním technologiím, jako je Illumina, a projevila schopnost aplikovat pokročilé metody analýzy transkriptomických dat. Praktická část práce je zpracována velmi podrobně a odráží nadprůměrnou aktivitu studentky, která se výrazně zapojila do tvorby a testování pipeliny pro RNA-Seq. Tento přístup vedl k prezentaci dvou příspěvků na studentské konferenci EEICT2024 a výsledky nejenže vytvořily pevný základ pro finální bakalářskou práci, ale mají také významný publikační potenciál. Tento fakt svědčí o průběžné aktivitě studentky během celého semestru. Implementace algoritmu v Pythonu, který kombinuje Pearsonův korelační koeficient a vzájemnou informaci, je inovativní a umožňuje detekci potenciálně koordinované regulace genové exprese nejen v Arabidopsis thalianě. Vizualizace výsledků pomocí heat-map a UPGMA dendrogramů byla provedena s vysokou precizností a poskytuje intuitivní ilustraci pro interpretaci výsledků. Studentka navíc prokázala schopnost efektivně využívat bioinformatické databáze jako JASPAR a PlantRegMap a smysluplně integrovala jejich výstupy do své analýzy. Aktivní zapojení do mezinárodní vědecké diskuse v rámci spolupráce s externím pracovištěm MoSys a Vídeňskou univerzitou je důkazem její schopnosti přispívat do vědeckého dialogu na vysoké úrovni. Díky intenzivní práci během celého semestru a pokračování v letních měsících studentka dokončila svou práci na úrovni vhodné k publikaci v recenzovaném časopise. V důsledku toho již nyní spolupracuje na vědecké studii s externím pracovištěm MoSys na Vídeňské univerzitě. Patrícia Janigová v průběhu své bakalářské práce prokázala mimořádnou schopnost samostatně řešit složité bioinformatické problémy a přinést originální zjištění s velkým potenciálem pro další výzkum. Vzhledem ke kvalitě práce a jejímu přínosu k pochopení ko-regulace genové exprese v Arabidopsis thalianě hodnotím práci výborně, a to 98 body.

Navrhovaná známka
A
Body
98

Posudek oponenta

Bartoň, Vojtěch

Předložená bakalářská práce pojednává o bioinformatickém zpracování RNA-seq dat pro účely identifikace potenciálně koregulovaných genů. Po formální stránce je práce na dobré úrovni úrovni. Práce je dostatečně strukturovaná a členěna do logicky uspořádaných kapitol. Práce vhodně pracuje s literaturou a cituje celkem 104 především anglicky psaných pramenů. Na bakalářskou práci je to více než dostatečné. Teoretický úvod poskytuje úvod ddo řešené problematiky a je vhodně doplněn obrazovou přílohou. V praktické části je představena vlastní pipeline pro zpracování RNA-seq dat. V zásadě je tento postup funkční, nicméně některého jeho kroky považuji za redundatní, zejména pak zpracování pair-end dat, jakoby šlo o single end, a následně kontrolovat validitu párů po každém kroku. Bylo by vhodnější využít možností zmíněných nástrojů nativně zpracovávat paired-end data. Z obr. 3.3. není jasné k jakému účelu slouží dvě count table a která je tím správným výstupem. Kontrola kvality mapování pomocí fastQC je pak zcela zbytečná a nepřináší potřebné informace. Normalizace pomocí DESeq2 by si pak zasloužila více rozvést. V textu je také občas zavádějící, či nepřesný popis některých metod, např. schopnost STAR detekovat místa spojení exonu a intronů nebo PCA a omezení na první dvě komponenty. Vybrané metody pro identifikaci co-regulovaných struktur JASPAR a PlantRegMap pak postrádají v práci své výstupy, či jejich větší diskuzi. Přitom na základě vybraných a otestovaných metod má být navržena vlastní implementace řešení detekce genů. Vlastní implementace pak spojuje informaci o korelaci expresního profilu genů se vzájemnou informací. V zásadě obě se oba tyto přístupu odvozují od společného jmenovatele závislosti jednotlivých komponent a tak zvolení dvou podobných metod vyžaduje zevrubnější diskuzi o jejich přístupu. Z hlediska analýzy je pak zvolené prahování mírně problematické, jelikož vychází z apriori známé informace o koregulaci daných genů. Diskusi v rámci kapitoly 5 musím pochválit, zejména pak práci s literaturou a spojení několik různých zdrojů. Srovnání s CHIP-seq je bohužel ukázáno pouze obrazově, na malém datasetu. Bylo by vhodné provést analýzu na kompletním datasetu a strojových datách, nikoliv pouze “okometricky”. Celkově je práce na dobré úrovni a naplňuje požadavky kladené na bakalářskou práci. Práci celkově hodnotím 70b/C.

Navrhovaná známka
C
Body
70

Otázky

eVSKP id 161972