BARILÍKOVÁ, L. Zpracování unikátních molekulárních indexů bez mapování k referenčnímu genomu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.
Studentka Lujza Barilíková se ve své práci zabývá velmi aktuální tématikou deduplikace sekvenačních čtení pomocí unikátních molekulárních identifikátorů (UMI). V teoretické části práce pojednává především o sekvenaci DNA a RNA, jednotlivých sekvenačních platformách a také o současných nástrojích pro zpracování UMI. V práci mi mírně chybí hlubší motivace pro využívání UMI, která by pomohla pochopit důležitost tématu širšímu okruhu čtenářů. Nicméně celkově je literární rešerše na vysoké úrovni a je podložena kvalitními referencemi. V praktické části práce studentka navrhla a implementovala zcela novou metodu pro zpracování sekvencí s UMI bez nutnosti zarovnání na referenční genom. Jedná se tedy o zcela unikátní metodu, která poskytuje srovnatelné, či dokonce mírně lepší výsledky než v současnosti často využívaný nástroj UMI-tools, který ovšem vyžaduje zarovnání sekvencí k referenčnímu genomu, což je časově velmi náročný krok. Srovnání metod je provedeno na testovacím datasetu uměle vytvořených sekvencí i reálných čtení, které studentka získala v rámci své spolupráce s centrální laboratoří bioinformatiky CEITEC. Zadání tedy považuji za bezezbytku splněné. K práci přistupovala studentka velmi svědomitě a jednotlivé kroky pravidelně konzultovala. Po formální stránce je práce na výborné úrovni, je psaná anglicky, srozumitelným jazykem a je prosta překlepů. S dílčími výsledky práce se studentka umístila na stupních vítězů v soutěži EEICT. Protože práce přináší zásadní původní výsledky, hodnotím ji jako výbornou.
Študentka Lujza Barilíková sa vo svojej práci zaoberala návrhom a implementáciou metódy pre spracovanie krátkych nukleotidových indexov - UMI - slúžiacich na označenie unikátnosti dlhších nukleotidových molekúl určených pre PCR amplifikáciu a následné sekvenovanie. Prínos týchto indexov v oblasti sekvenovania a bioinformatiky obecne je nepopierateľne významný. Výrazne pomáhajú riešiť prastarú dilemu duplikácie sekvenovaných fragmentov, konkrétne, či sa jedná o biologické alebo technické replikáty daného fragmentu na základe zhlukovania sekvencií s rovnakými (alebo veľmi podobnými) UMI. Väčšina dostupných nástrojov rieší tento problém pomocou mapovania na genóm, opravou prípadných chýb sekvenovania a nasleduje odstraňovanie technických replikátov. V dôsledku nejednoznačnosti mapovania niektorých fragmentov dochádza k strate presnosti a dát obecne. Študentka si dala za cieľ vyskúšať iné riešenie tohto problému. Konkrétne začína vo svojej metóde zjednocovaním fragmentov na základe identity (podobnosti) UMI a následne odstraňuje technické replikáty ešte pred mapovaním na genóm. Študentka si urobila riadny prieskum využívaných metód a nástrojov a v kapitole 4 diskutuje ich výhody a nevýhody. V kapitole 5 popisuje implementáciu svojho prístupu dostatočne a zrozumiteľne. Kapitola 6 porovnáva jej nástroj s najpoužívanejším nástrojom súčasnosti na odstraňovanie UMI zo sekvenovaných fragmentov na množine simulovaných dát so známym podielom biologických aj technických replikátov ako aj na reálnych klinických dátach. Na porovnanie výsledkov sú použité jednoduché, ale vhodné štatistické vzorce, bežne sa používajúce v praxy (presnosť, citlivosť, atď). Rovnako je vyhodnotená efektivita implementácie, ktorá je trochu sklamaním. Hoci výsledky oboch nástrojov sú rovnako kvalitné, stále zostáva nespornou výhodou nového nástroja, že nevyžaduje mapovanie na referenčný genóm, ktorý v prípade novo skúmaných organizmov nemusí existovať. Práca je napísaná v anglickom jazyku dobrej kvality, je vhodne štruktúrovaná aj formátovaná a obsahuje primerané množstvo obrázkov a tabuliek, ktoré uľahčujú pochopiteľnosť textu. Celkovo tato práca ukazuje, že je študentka schopná urobiť odborný výskum zahŕňajúci prieskum, návrh riešenia, implementáciu, vyhodnotenie a následné kritické zhodnotenie problému na úrovni magisterského študenta. Až na čudný názov nástroja nemám k práci žiadne vačšie výhrady. Mohlo byť zaujímavé urobiť benchmarking voči všetkým zmieneným nástrojom z kapitoly 4, no porovnanie s nástrojom UMI-tools, ako zlatým štandardom, by malo byť dostatočné. Nástroj som netestoval, ale bol som osobne svedkom jeho funkčnosti už v priebehu implementácie. Prácu hodnotím na A/95 bodov.
eVSKP id 126827