Genomická predikce založená na hlubokém učení pomocí sítí LSTM
Loading...
Date
Authors
Komjaty, Daniel
ORCID
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato bakalářská práce se věnuje problematice genomické predikce s využitím predikčních metod založených na strojovém učení. V první části se práce zabývá teoretickou rešerší s užším zaměřením na genomickou predikci a její aplikaci v rámci rostlinných dat. Dále se zabývá predikčními algoritmy a modely založenými na strojovém učení, které se využívají pro genomické predikce. Další část obsahuje podrobnější popis použitých genomických a metabolomických dat poskytnutých od vedoucí práce. Ve čtvrté části je popsána samotná implementace vybraných modelů strojového učení. Poslední pátá část se zabývá zhodnocením modelů strojového učení a diskuzí k výsledkům.
This bachelor's thesis deals with the problem of genomic prediction using machine learning based prediction methods. The first part of the thesis deals with theoretical review with a narrower focus on genomic prediction and its application to plant data. Thesis then discusses prediction algorithms and machine learning based models that are used for genomic prediction. The following section contains a more detailed description of the used genomic and metabolomic data, provided by the thesis supervisor. The fourth section describes the actual implementation of the selected machine learning models. The last fifth section deals with the evaluation of the machine learning models and discussion of the results.
This bachelor's thesis deals with the problem of genomic prediction using machine learning based prediction methods. The first part of the thesis deals with theoretical review with a narrower focus on genomic prediction and its application to plant data. Thesis then discusses prediction algorithms and machine learning based models that are used for genomic prediction. The following section contains a more detailed description of the used genomic and metabolomic data, provided by the thesis supervisor. The fourth section describes the actual implementation of the selected machine learning models. The last fifth section deals with the evaluation of the machine learning models and discussion of the results.
Description
Keywords
predikční metody, strojové učení, hřebenová regrese, operátor nejmenšího absolutního zmenšení a výběru, náhodný les, sítě s dlouhou-krátkodobou pamětí, genomická predikce, prediction methods, machine learning, ridge regression, least absolute shrinkage and selection operator, random forest, long short-term memory networks, genomic prediction
Citation
KOMJATY, D. Genomická predikce založená na hlubokém učení pomocí sítí LSTM [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
bez specializace
Comittee
doc. Ing. Jiří Hozman, Ph.D. (předseda)
doc. Mgr. Ing. Karel Sedlář, Ph.D. (místopředseda)
Ing. Roman Jakubíček, Ph.D. (člen)
Ing. Vratislav Čmiel, Ph.D. (člen)
MUDr. Zuzana Nováková, Ph.D. (člen)
Ing. Vojtěch Bartoň (člen)
Date of acceptance
2024-06-11
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Dr. Jakubíček se zeptal, co je vstupem. V jaké formě jsou uložené pozice? Okomentoval použití LSTM vzhledem ke vstupu. Doc. Sedlář se doptal na vstup. Dr. Jakubíček se zeptal na použití 2 dropout. Proč konkrétně LSTM, dropout, LSTM, dropout? Jak byly dlouhé vstupy signálů? Proč máte korelační koeficient v procentech? Co znamená daná hodnota MSE? Jak jste dělil data na trénovací a testovací?
Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení