Predikce vlivu mutací na imunogenicitu proteinů založená na strojovém učení
but.committee | prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) prof. Ing. Radomil Matoušek, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Musil, Miloš | en |
dc.contributor.author | Lacko, Dávid | en |
dc.contributor.referee | Martínek, Tomáš | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Imunitný systém je dôležitou súčasťou prežitia človeka, pretože je zodpovedný za ochranu tela pred patogénmi. Táto schopnosť vyplýva z molekulárnych mechanizmov rozpoznávania cudzorodých bielkovín a molekúl. Hoci je imunitný systém rozhodujúci pre prežitie, bráni využívaniu proteínov pochádzajúcich z iných organizmov ako bioterapeutík, z ktorých mnohé už preukázali významný potenciál v zdravotníctve. Na využitie tohto potenciálu je nevyhnutné, aby imunitný systém tieto proteíny nenapadol a nedeaktivoval. Preto je často potrebné tieto proteíny upraviť tak, aby sa znížila ich imunogénnosť a zabránilo sa ich detekcii imunitným systémom. Na tento účel vedci zavádzajú mutácie do proteínu, ktorý je predmetom záujmu, aby znížili imunitnú odpoveď. Rozsiahle experimentálne overovanie takýchto mutácií je zvyčajne neuskutočniteľné vzhľadom na obrovskú veľkosť kombinatorického priestoru, ktorý treba preskúmať. Pomocou nástrojov strojového učenia možno tento proces urýchliť a výrazne znížiť celkové náklady na vývoj tým, že sa mutácie najprv vyhodnotia in silico a experimentálne sa overí len podmnožina sľubných návrhov z užšieho výberu. Oblasť nástrojov založených na strojovom učení na predpovedanie takýchto mutačných účinkov však ešte nie je preskúmaná. Na vyriešenie tejto výzvy predstavujeme nový súbor dát zameraný na vplyv mutácií na epitopy - oblasti bielkovín, ktoré spúšťajú reakciu imunitného systému. Novo zhromaždený súbor dát obsahuje epitopy, ich jednobodové a dvojbodové mutácie a vplyv týchto mutácií na imunogénnosť. Využitím tohto nového súboru a nedávnych pokrokov v oblasti veľkých jazykových modelov pre proteínové inžinierstvo sme natrénovali súbor modelov založených na strojovom učení, ktoré sú schopné klasifikovať mutácie na základe ich vplyvu na imunogenicitu, pričom vykazujú výrazné zlepšenie výkonu oproti existujúcim a základným modelom. Okrem toho prezentujeme spôsob rozdelenia súboru dát na rôzne tréningovo-testovacie rozdelenia s cieľom minimalizovať prienik údajov medzi týmito rozdeleniami. To vedie k spoľahlivejšiemu ohodnoteniu reálnej výkonnosti modelov natrénovaných na týchto údajoch. | en |
dc.description.abstract | The immune system is a vital part in human survival since it is responsible for protecting the body against pathogens.This ability stems from molecular mechanisms for the recognition of non-human proteins and molecules. While this system is critical for survival, it hampers the use of non-human proteins as biotherapeutics, many of which have already demonstrated significant potential in healthcare. To exploit this potential, it is vital that the immune system does not attack and inactivate the proteins. Therefore, it is often necessary to engineer these proteins to reduce the immunogenicity and avoid early detection by the immune system. To this end, scientists introduce mutations to a protein of interest to lower the response. Large-scale experimental validation of such mutations is typically unfeasible due to the enormous size of combinatorial space to explore. With the help of machine learning tools, this process can be accelerated and total development cost significantly reduced by scoring the mutations in silico first and experimentally validating only a subset of short-listed viable designs. However, the field of machine-learning-based tools for predicting such mutational effects is yet to be explored. To address this challenge, we present a novel dataset focused on the effect of mutations on epitopes - protein regions that trigger the immune system response. The newly collected dataset contains epitopes, their single and double-point mutations, and the effect of these mutations on imunogenicity as labels. By leveraging this novel dataset and recent advances in large language models for protein engineering, we train a set of machine-learning-based models that are able to classify mutations based on their effect on immunogenicity, showing a significant improvement in performance over the baselines. Additionally, we investigate and present a way to separate the dataset into different train-test splits to minimize data leakage between these splits. This leads to a more robust real-world performance evaluation of the models trained on this data. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | LACKO, D. Predikce vlivu mutací na imunogenicitu proteinů založená na strojovém učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 157051 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/248579 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | strojové učenie | en |
dc.subject | imunoinformatika | en |
dc.subject | proteínové inžinierstvo | en |
dc.subject | predikcia imunogenicity | en |
dc.subject | machine learning | cs |
dc.subject | immunoinformatics | cs |
dc.subject | protein engineering | cs |
dc.subject | immunogenicity prediction | cs |
dc.title | Predikce vlivu mutací na imunogenicitu proteinů založená na strojovém učení | en |
dc.title.alternative | Machine Learning-based Prediction of Mutational Effects on Protein Immunogenicity | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2024-06-17 | cs |
dcterms.modified | 2024-06-17-14:16:39 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 157051 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:38:07 | en |
sync.item.modts | 2025.01.15 21:27:33 | en |
thesis.discipline | Bioinformatika a biocomputing | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |