BOHÁČOVÁ, H. Detekce patogenních mutací z RNAseq dat u pacientů s kolorektálním karcinomem [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.

Posudky

Posudek vedoucího

Čejková, Darina

Bakalářská práce Hany Boháčové se zabývá detekcí patogenních mutací pacientů s kolorektálním karcinomem na základě analýzy dat z RNA-seq experimentu a sekvenovaného onkopanelu. Bakalářská práce byla vypracována na RECETOXU Masarykovy univerzity. Práce je vypracovaná na 45 stránkách a opírá se především o zahraniční literaturu, celkem bylo použito 60 citací. Teoretická část práce čtenáře seznamuje s problematikou kolorektálního karcinomu, jeho genetickou predispozicí a somatickými mutacemi. Čtenář je dále seznámen s technikami next-gen sekvenováním, analýzou sekvenčních dat a vyhodnocením výsledků. V praktické části se studentka zabývá vlastní analýzou. Bohužel tato část práce je nedokončená, výsledky není schopen čtenář pochopit ani z obrázků a tabulek, ani z textu. Navíc výsledky neodpovídají očekávání a z časového důvodu je nebylo možno ověřit. Práci hodnotím 40 body/F. K posudku přikládám i vyjádření školitelky-konzultantky, pod kterou práce byla vypracována (mírně upraveno: Studentka oslovila naší skupinu (skupina doktorky Evy Budinske, RECETOX, MUNI) na jaře 2021 a zajímala se o možnosti pracovní stáže a vypracování bakalářské práce pod naším vedením. Po domluvě byla zadaná táto bakalářská práce, která se řadí spíše k těm náročnějším na vypracování a to nejen z hlediska časového, ale i z hlediska schopností vyhledávat relevantní informace, správně je zpracovat a aplikovat je na reálná data. Studentka k vypracování bakalářské práce musela pochopit princip vzniku a analýzy sekvenčních dat, v tomto případě konkrétně RNAseq dat (sekvenování transkriptomu). Studentka musela nastudovat velké množství literatury dostupné pouze v anglickém jazyce. K vypracování praktické části bakalářské práce pak musela využít zdrojů MetaCentra. Studentka bohužel od začátku zaujala laxní přístup k vypracování bakalářské práce, což se projevilo i na kvalitě zpracované rešerše dostupných metod. Studentka začala usilovně komunikovat a pracovat na bakalářské práci v posledním měsíci, kdy již bylo jasné, že je nemožné stihnout zpracovat data z genomických experimentů, jejichž zpracování obvykle i zkušenému bioinformatikovi trvá několik měsíců. Studentka se navíc potýkala s řadou problémů v průběhu psaní pipeliny na zpracování dat, které se snažila ihned konzultovat. Zde bych ocenila větší samostatnost studentky. Místy to na mne působilo dojmem, že se studentka ani nesnaží hledat řešení na odborných fórech, kde je možné čerpat zkušenosti jiných uživatelů a mnohdy je tam i napsaný skript s funkčním řešením. Text bakalářské práce je taktéž ovlivněn faktem, že studentka začala pracovat na poslední chvíli a nebyl prostor pro vedoucí a konzultantku text se studentkou projít. Některé formulace jsou značně nešťastné, vyjadřování je místy neodborné. Text práce je dost nevyrovnaný. Výsledky, ke kterým se stihla studentka dostat, nejsou na můj vkus dostatečně popsané.

Navrhovaná známka
F
Body
40

Posudek oponenta

Šabatová, Kateřina

Studentka Hana Boháčová se ve své bakalářské práci věnuje detekci patogenních mutací v RNA-Seq datech pacientů s kolorektálním karcinomem. V literární rešerši se studentka zabývá příčinami vzniku kolorektálního karcinomu, sekvenování pomocí Illumina sekvenátorů, detekci mutací, srovnáním metod mapování a srovnáním metod vyhledávání mutací v RNA-Seq datech. Tato teoretická část je místy nelogicky členěna např. v podkapitole detekce mutací je část věnující se druhům mutací z pohledu dědičnosti a další navazující část pojednává o phred skóre. Části věnující se srovnání různých metod jsou pak velice stručné a v podstatě jde jen o výčet nástrojů jejichž popis je uvedený v tabulkách. Ty jsou nepřehledné, uvádějí nástroje, které s danou problematikou přímo nesouvisí (viz tabulka 1.4) nebo naopak nástroj Mutect2, který studentka používá v práci, ve zmíněné tabulce úplně chybí. Značná část literární rešerše také není vůbec referencována a literatura není číslována podle výskytu. V praktické části studentka navrhla postup zpracování, která zahrnuje kontrolu kvality RNA-Seq dat, mapování dat k referenci, detekci a anotaci mutací. Pro mapování dat není popsáno nebo zdůvodněno nastavení použitého nástroje STAR. Dále je konstatováno, že mapování nedopadlo nijak dobře, přičemž není uvedeno, co je považováno za úspěšné mapování nebo jak by ho bylo možné docílit. Tento problém studentka neřeší a pokračuje dalším zpracováním namapovaných čtení pro detekci mutací a detekcí samotnou. Zde opět postrádám popis použitých parametrů jednotlivých nástrojů. Na závěr je provedena filtrace nalezených mutací a jejich anotace. V poslední kapitole jsou stroze diskutovány výsledky celé práce. Nejprve jsou zde uvedeny výsledky detekce mutací u cíleného sekvenování, které jsou prezentovány pouze na obrázcích 4.1 a 4.2 bez podrobnějšího popisu nebo vysvětlení. Samotné výsledky studentky, konkrétní detekované mutace z RNA-Seq dat, pak nejsou v práci nikde uvedeny a nejsou ani přílohou práce samotné. Je tedy nutné se pouze spokojit s číslem 189, což podle zavádějícího popisu a obrázku 4.3 počet detekovaných patogenních mutací. Porovnání výsledku z RNA-Seq dat a cíleného sekvenování je provedeno pouze graficky bez bližšího popisu či diskuze. Za zmínku pak stojí také poslední věta celé práce, která pravděpodobně shrnuje celou praktickou část práce: „V okamžiku odevzdání práce byli k dispozici pouze neprůkazné výsledky, které zde není vhodné presentovat.“ Po formální stránce je práce na podprůměrné úrovni. V práci se např. vyskytují špatně naformátované tabulky (tabulka 1.3, 1.4), vložené prázdné řádky (strana 33, 34, 36), odstavce o jediné větě, nevysvětlené zkratky nebo nekvalitní a nečitelné obrázky (obrázek 4.1 až 4.4). Práce také obsahuje řadu gramatických chyb a překlepů. Z výše uvedených důvodů tak považuji zejména poslední bod zadání práce za nesplněný, práci hodnotím stupněm F (40 bodů) a doporučuji práci k přepracování.

Navrhovaná známka
F
Body
40

Otázky

eVSKP id 142119