Strojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinu

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Jan Janoušek, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně (A). Otázky u obhajoby: Dokázal by jste zdůvodnit, proč metoda KStar dosahuje pro tento typ úlohy výrazně lepších výsledků v porovnání s ostatními technikami strojového učení? Bylo by možné testovací dataset vytvořit i jiným způsobem, než ze souboru více-bodových mutací?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBendl, Jaroslavcs
dc.contributor.authorMalinka, Františekcs
dc.contributor.refereeMartínek, Tomášcs
dc.date.created2014cs
dc.description.abstractTato práce popisuje nový přístup k predikci vlivu aminokyselinových mutací na změnu stability proteinu. Cílem je vytvořit nový meta-nástroj, který kombinuje výstupy osmi vybraných nástrojů, díky čemuž je schopen svoji predikční schopnost zlepšit. Pro nalezení optimálního konsenzu mezi těmito nástroji je použito různých metod strojového učení. Ze všech testovaných metod strojového učení dosahuje KStar nejvyšší úspěšnosti predikce na trénovacím datasetu tvořeného experimentálně ověřenými mutacemi z databáze ProTherm. Právě z tohoto důvodu je KStar vybrán jako optimální predikční technika. Pro prokázání korektnosti výsledků tohoto meta-nástroje je použito testovacího datasetu vytvořeného ojedinělým způsobem, a to z vícebodových mutací extrahovaných taktéž z databáze ProTherm. Jelikož nebyly vícebodové mutace použity pro natrénování žádného z integrovaných nástrojů, předpokládá se, že takovéto porovnání je objektivní. Ve výsledku se tímto přístupem podařilo pomocí metody strojového učení KStar zvýšit korelační koeficient na trénovacím datasetu o 0,130, respektive o 0,239 na datasetu testovacím oproti nejúspěšnějšímu integrovanému nástroji. Na základě zjištěných údajů je možné říci, že metody strojového učení jsou vhodnými technikami pro problémy z oblasti proteinových predikcí.cs
dc.description.abstractThis thesis describes a new approach to the detection of protein stability change upon amino acid mutations. The main goal is to create a new meta-tool, which combines the outputs of eight well-established prediction tools and due to suitable method of consensus making, it is able to improve the overall prediction accuracy. The optimal strategy of combination of outputs of these tools is found by using a various number of machine learning methods. From all tested machine learning methods, KStar showed the highest prediction accuracy on the training dataset compiled from experimentally validated mutations originating from ProTherm database. Due to this reason, it is chosen as an optimal prediction technique. The general prediction abilities is validated on the testing dataset composed of multi-point amino acid mutations extracted also from ProTherm database. Since the multi-point mutations were not used for training any of integrated tools, we suppose that such comparison is objective. As a result, the developed meta-tool based on KStar technique improves the correlation coefficient about 0.130 on the training dataset and 0.239 on the testing dataset, respectively (the comparison is being made against the most succesful integrated tool). Based on the obtained results, it is possible to claim that machine learning methods are suitable technique for the problems from area of protein predictions.en
dc.description.markAcs
dc.identifier.citationMALINKA, F. Strojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.cs
dc.identifier.other79681cs
dc.identifier.urihttp://hdl.handle.net/11012/53278
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPredikce stabilitycs
dc.subjectstabilita proteinucs
dc.subjectstrojové učenícs
dc.subjectmutace proteinucs
dc.subjectprotherm.cs
dc.subjectStability predictionen
dc.subjectprotein stabilityen
dc.subjectmachine learningen
dc.subjectprotein mutationen
dc.subjectprotherm.en
dc.titleStrojové učení v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinucs
dc.title.alternativePrediction of Protein Stability upon Mutations Using Machine Learningen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2014-06-24cs
dcterms.modified2020-05-10-16:11:28cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79681en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:17:14en
sync.item.modts2025.01.17 10:21:43en
thesis.disciplineBioinformatika a biocomputingcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.15 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79681.html
Size:
1.48 KB
Format:
Hypertext Markup Language
Description:
file review_79681.html
Collections