Nástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střeva

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, CSc. (místopředseda) RNDr. Petr Fuchs, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na otázku přítomného člena. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře (C) . Otázky u obhajoby: V práci používáte algoritmus kNN. Zkoušel jste více metrik pro posouzení vzdálenosti mezi vzorky? Jak dobře by fungovala např. kosinova vzdálenost, resp. Pearsonova korelační vzdálenost? Zkoušel jste pro výběr rysů použít nějakou z již publikovaných metod? Např. LASSO? Jak si vysvětlujete, že algoritmus LDA byl schopen za daných podmínek oddělit třídy atributu diet_type? Dosáhl by natrénovaný model stejného výsledku i na dosud nepozorovaných datech?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmatana, Stanislavcs
dc.contributor.authorKubica, Jancs
dc.contributor.refereeHon, Jiřícs
dc.date.created2019cs
dc.description.abstractTato práce se zabývá analýzou lidského mikrobiomu na základě metagenomických dat z tlustého střeva. Předmětem zkoumání je zastoupení bakterií na různých taxonomických úrovních v závislosti na životním stylu jedince. Byl vytvořen nástroj klasifikující jednotlivé atributy, jako jsou stravovací návyky (vegetarián, vegan, všežravec), citlivost na lepek a laktózu, body mass index nebo věk či pohlaví, s využitím metod strojového učení. Při implementaci byly zvoleny metody k nejbližších sousedů (kNN), náhodný les (RF) a metoda podpůrných vektorů (SVM). Data pro natrénování klasifikátoru a vyhodnocení byla čerpána z projektu American Gut. Práce se rovněž zaobírá problémy spojenými s danými datovými sadami, jako je mnoharozměrnost, řídkost, jejich kompoziční závislost a nevyváženost.cs
dc.description.abstractThis thesis deals with analysis of human microbiome using metagenomic data from large intestine. The main focus is placed on bacteria composition in a sample on different taxonomic levels regarding the lifestyle traits of an individual. For this purpose, a tool for classification of several attributes was created. It considers attributes like diet type and eating habits (vegetarian, vegan, omnivore), gluten and lactose intolerance, body mass index, age or sex. From range of machine learning perspectives considering K Nearest Neighbours (kNN), Random Forest (RF) and Support Vector Machines (SVM) were used. Datasets for training and final evaluation of the classifier were taken from American Gut project. The thesis also focuses on particular problems with metagenomic datasets like its multidimensionality, sparsity, compositional character and class imbalance.en
dc.description.markCcs
dc.identifier.citationKUBICA, J. Nástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střeva [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122228cs
dc.identifier.urihttp://hdl.handle.net/11012/180293
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectmetagenomikacs
dc.subjecttaxonomiecs
dc.subjectOTUcs
dc.subjectpredikcecs
dc.subjectklasifikacecs
dc.subjectstrojové učenícs
dc.subjectk nejbližších sousedůcs
dc.subjectmetoda podpůrných vektorůcs
dc.subjectnáhodný lescs
dc.subjectT-testcs
dc.subjectanalýza hlavních komponentcs
dc.subjectlineární diskriminační analýzacs
dc.subjectmetagenomicsen
dc.subjecttaxonomyen
dc.subjectOTUen
dc.subjectpredictionen
dc.subjectclassificationen
dc.subjectmachine learningen
dc.subjectK Nearest Neighboursen
dc.subjectSupport Vector Machinesen
dc.subjectRandom Foresten
dc.subjectT-testen
dc.subjectPrincipal Component Analysisen
dc.subjectLinear Discriminant Analysisen
dc.titleNástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střevacs
dc.title.alternativeTool for Classification of Lifestyle Traits Based on Metagenomic Data from the Large Intestineen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-13cs
dcterms.modified2019-07-08-13:31:34cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122228en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:26:24en
sync.item.modts2025.01.15 13:59:06en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.44 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22114_v.pdf
Size:
86.78 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22114_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22114_o.pdf
Size:
91.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22114_o.pdf
Loading...
Thumbnail Image
Name:
review_122228.html
Size:
1.51 KB
Format:
Hypertext Markup Language
Description:
file review_122228.html
Collections