Strojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinu
but.committee | prof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Jan Janoušek, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně (A). Otázky u obhajoby: Dokázal by jste zdůvodnit, proč metoda KStar dosahuje pro tento typ úlohy výrazně lepších výsledků v porovnání s ostatními technikami strojového učení? Bylo by možné testovací dataset vytvořit i jiným způsobem, než ze souboru více-bodových mutací? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bendl, Jaroslav | cs |
dc.contributor.author | Malinka, František | cs |
dc.contributor.referee | Martínek, Tomáš | cs |
dc.date.created | 2014 | cs |
dc.description.abstract | Tato práce popisuje nový přístup k predikci vlivu aminokyselinových mutací na změnu stability proteinu. Cílem je vytvořit nový meta-nástroj, který kombinuje výstupy osmi vybraných nástrojů, díky čemuž je schopen svoji predikční schopnost zlepšit. Pro nalezení optimálního konsenzu mezi těmito nástroji je použito různých metod strojového učení. Ze všech testovaných metod strojového učení dosahuje KStar nejvyšší úspěšnosti predikce na trénovacím datasetu tvořeného experimentálně ověřenými mutacemi z databáze ProTherm. Právě z tohoto důvodu je KStar vybrán jako optimální predikční technika. Pro prokázání korektnosti výsledků tohoto meta-nástroje je použito testovacího datasetu vytvořeného ojedinělým způsobem, a to z vícebodových mutací extrahovaných taktéž z databáze ProTherm. Jelikož nebyly vícebodové mutace použity pro natrénování žádného z integrovaných nástrojů, předpokládá se, že takovéto porovnání je objektivní. Ve výsledku se tímto přístupem podařilo pomocí metody strojového učení KStar zvýšit korelační koeficient na trénovacím datasetu o 0,130, respektive o 0,239 na datasetu testovacím oproti nejúspěšnějšímu integrovanému nástroji. Na základě zjištěných údajů je možné říci, že metody strojového učení jsou vhodnými technikami pro problémy z oblasti proteinových predikcí. | cs |
dc.description.abstract | This thesis describes a new approach to the detection of protein stability change upon amino acid mutations. The main goal is to create a new meta-tool, which combines the outputs of eight well-established prediction tools and due to suitable method of consensus making, it is able to improve the overall prediction accuracy. The optimal strategy of combination of outputs of these tools is found by using a various number of machine learning methods. From all tested machine learning methods, KStar showed the highest prediction accuracy on the training dataset compiled from experimentally validated mutations originating from ProTherm database. Due to this reason, it is chosen as an optimal prediction technique. The general prediction abilities is validated on the testing dataset composed of multi-point amino acid mutations extracted also from ProTherm database. Since the multi-point mutations were not used for training any of integrated tools, we suppose that such comparison is objective. As a result, the developed meta-tool based on KStar technique improves the correlation coefficient about 0.130 on the training dataset and 0.239 on the testing dataset, respectively (the comparison is being made against the most succesful integrated tool). Based on the obtained results, it is possible to claim that machine learning methods are suitable technique for the problems from area of protein predictions. | en |
dc.description.mark | A | cs |
dc.identifier.citation | MALINKA, F. Strojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014. | cs |
dc.identifier.other | 79681 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/53278 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Predikce stability | cs |
dc.subject | stabilita proteinu | cs |
dc.subject | strojové učení | cs |
dc.subject | mutace proteinu | cs |
dc.subject | protherm. | cs |
dc.subject | Stability prediction | en |
dc.subject | protein stability | en |
dc.subject | machine learning | en |
dc.subject | protein mutation | en |
dc.subject | protherm. | en |
dc.title | Strojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinu | cs |
dc.title.alternative | Prediction of Protein Stability upon Mutations Using Machine Learning | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2014-06-24 | cs |
dcterms.modified | 2020-05-10-16:11:28 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 79681 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:17:14 | en |
sync.item.modts | 2025.01.17 10:21:43 | en |
thesis.discipline | Bioinformatika a biocomputing | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |