Evoluční strategie v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinů
Loading...
Date
Authors
Kadlec, Miroslav
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce se zabývá predikcí vlivu aminokyselinových mutací na stabilitu proteinu. Cílem je vytvořit konsenzuální prediktor využívající výstupy vybraných existujících nástrojů za účelem zvýšení úspěšnosti predikce. Optimální konsenzus mezi těmito nástroji byl hledán s pomocí evolučních strategií (ES) ve třech variantách: evoluční strategie s pravidlem 1/5, varianta s autoevolucí typu 2 a metoda CMA-ES. Kvalita nalezených řešení byla následně testována na nezávislé datové sadě. Výsledky všech tří variant dosahovaly podobných přesností predikce, jako nejlepší byl vyhodnocen vektor vah nalezený ES s autoevolucí typu 2. Oproti samostatným prediktorům vykazovala konsenzuální metoda na trénovacích datech zlepšení Pearsonova korelačního koeficientu o 0,057. Na testovací sadě byl její přínos nižší (zlepšení o 0,040). Poměrně malý přínos k přesnosti predikcí na trénovací i testovací datové sadě byl způsoben tím, že pro některé záznamy se nepodařilo získat výsledky všech dílčích nástrojů. V případě vypuštění těchto záznamů přinesla konsenzuální metoda zlepšení Pearsonova korelačního koeficientu o 0,118.
This thesis is focused on predicting the impact of amino acid substitution on protein stability. The main goal is to create a consensual predictor that uses the outputs of chosen existing tools in order to improve accuracy of prediction. The optimal consensus of theese tools was designed using evolution strategies in three variants: 1/5 success rule, self-adaptation variant and the CMA-ES method. Then, the quality of calculated weight vectors was tested on the independent dataset. Although the highest prediction performance was attained by self-adaptation method, the differences between all three variants were not significant. Compared to the individual tools, the predictions provided by consensual methods were generally more accurate - the self-adaptation variant imporved the Pearson's corelation coeficient of the predictions by 0,057 on the training dataset. On the testing dataset, the improvement of designed method was smaller (0,040). Relatively low improvement of prediction performance (both on the training and the testing dataset) were caused by the fact, that for some records of testing dataset, some individual tools vere not able to provide their results. When omitting these records, consensual method improved the Pearson's corelations coeficient by 0,118.
This thesis is focused on predicting the impact of amino acid substitution on protein stability. The main goal is to create a consensual predictor that uses the outputs of chosen existing tools in order to improve accuracy of prediction. The optimal consensus of theese tools was designed using evolution strategies in three variants: 1/5 success rule, self-adaptation variant and the CMA-ES method. Then, the quality of calculated weight vectors was tested on the independent dataset. Although the highest prediction performance was attained by self-adaptation method, the differences between all three variants were not significant. Compared to the individual tools, the predictions provided by consensual methods were generally more accurate - the self-adaptation variant imporved the Pearson's corelation coeficient of the predictions by 0,057 on the training dataset. On the testing dataset, the improvement of designed method was smaller (0,040). Relatively low improvement of prediction performance (both on the training and the testing dataset) were caused by the fact, that for some records of testing dataset, some individual tools vere not able to provide their results. When omitting these records, consensual method improved the Pearson's corelations coeficient by 0,118.
Description
Citation
KADLEC, M. Evoluční strategie v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda)
prof. RNDr. Alexandr Meduna, CSc. (místopředseda)
Ing. Vladimír Bartík, Ph.D. (člen)
doc. Ing. Tomáš Martínek, Ph.D. (člen)
Ing. William Steingartner, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
Date of acceptance
2015-06-22
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: V technické zprávě naznačujete, že metoda dosahovala lepších výsledků pro datovou množinu s pouze kompletními záznamy. Neuvažoval jste o tom, provést trénování/testování Vašeho prediktoru pouze s touto datovou množinou (například pomocí křížové validace)?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení