NEMČEKOVÁ, P. Dynamická predikce metabolitů z genetické variace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.

Posudky

Posudek vedoucího

Schwarzerová, Jana

Studentka Petra Nemčeková vypracovala diplomovou práci na téma Dynamické predikce metabolitů z genetické variace. V rámci teoretické rešerše nastudovala problematiku Genetické variace související s pochopením principů genové mutace, sekvenačními technikami nové generace, genomické predikce a v neposlední řadě celogenomové asociační studie. Dále studentka nastudovala a výstižně v práci shrnula základy metabolomiky, kterou rozčlenila do tří části, jmenovitě se jedná o metabolomickou analýzu, metabolomické predikce a metabolické celogenomové asociační studie. V praktické části se studentka soustředila na analýzu rostliny Hordeum vulgare, ve které vymodelovala za pomocí metod strojového učení predikční modely popisující metabolomické koncentrace na základě genové variace reprezentující informaci jednonukleoditových polymorfismů. Práce obsahuje popis predikčních metod používaných v predikční analýze metabolomických regresních modelů. Metodika vyhodnocení predikčních modelů byla převzatá z impaktovaného článku publikovaného v roce 2020, tudíž se jedná o opravdu aktuální studovanou problematiku. Menší výtky mám v tom, že práce neobsahuje rrBLUP či BGLR balíček, které jsou nyní celkově v bioinformatických predikcích pomocí jazyka R hojně využívané. Na druhou stranu diplomová práce má veškeré kódy implementované v programovacím jazyce Python. Díky tomu je zcela pochopitelné, že se studentka zabývala v praktické části hlavně funkcemi, metodami a knihovnami, které jsou implementované v jazyce Python nikoli v jazyce R. Práce trpí i některými formálními nedostatky, např. nesprávné citace u rovnic, nevhodné formátování křížových odkazů na obrázky. Některé kapitoly bohužel působí rozepsaným stylem, např. kapitola 2.3 obsahuje nastínění třech zajímavých studií, ale nedostatečného dovysvětlení, proč jsou tyto studie zmíněné. Tyto nedostatky jsou převážně způsobeny ucelením textové podoby práce až během posledních dnů před odevzdáním. Nicméně musím vyzdvihnout použití anglického jazyka, který je v této problematice mnohem vhodnější pro využití v širší vědecké komunitě než čeština samotná. Celkově studentka k práci přistupovala svědomitě. O její aktivitě vypovídají i účasti hned na dvou studentských konferencích, kdy na studentské konference EEICT2022 se studentka účastnila aktivně jako prvoautorka svého vlastního příspěvku, kde prezentovala průběžné výsledky své práce. A na studentské konferenci Biomania2022 se studentka účastnila pasivně díky jejímu spoluautorskému přínosu. I přes uvedené výtky, zadání práce považuji za splněné. Práce cituje 99 položek literatury, převážně se jedná o zahraniční zdroje a vědecké články. Práci doporučuji k obhajobě a hodnotím stupněm velmi dobře (B - 80 bodů).

Navrhovaná známka
B
Body
80

Posudek oponenta

Weckwerth, Wolfram

I have reviewed the master thesis of Bc. Petra Nemčeková. The aim of the thesis has been to evaluate different genomic prediction tools to predict the metabolome (multivariate) or specific metabolites (univariate) from single nucleotide polymorphisms in the genome of the organism under study. In her study Miss Nemcekova has chosen a dataset of Hordum vulgare, Barley, with available metabolite data and a SNP dataset from a publication. Miss Nemčeková started in her thesis with an indepth review about available methods for genomic prediction in the introduction as well as an introduction to metabolomics and available literature using genomic prediction for metabolome prediction. One misunderstanding is the terminus metabolomic prediction which is different from genomic prediction. Metabolomic prediction implies the usage of metabolite data to predict traits or phenotypes. In this study only genomic prediction of the metabolome is performed. Furthermore, metabolic GWAS is introduced but to my knowledge not performed in the master thesis. On the other hand in the end of the thesis a potential gene is discussed which is according to the position not in the region of the used SNPs. This is a bit confusing, why not choosing genes which are part of the SNP collection? Why is there only such a small part of the genome used? The data processing is nicely described and the comparative analysis of predictive value of the different methods is very helpful as a first step for follow up studies in this direction. The method description, especially the part of the cross-validation, which is a most important step for validating the results, is not well described in the thesis. In summary, this is a highly interesting and valuable study which leads the way to follow up studies important to link genome variation and metabolome dynamics. 60 points - D

Navrhovaná známka
D
Body
60

eVSKP id 142097