Dolování rozpustných enzymů z genomických databází

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Jan Holub, Ph.D. (člen) doc. RNDr. David Hoksza, Ph.D. (člen) doc. RNDr. Radka Svobodová, Ph.D. (člen) doc. RNDr. David Šafránek, Ph.D. (člen)cs
but.defenceStudent přednesl cíle a výsledky, kterých v rámci řešení disertační práce dosáhl. V rozpravě student odpověděl na otázky komise a oponentů. Diskuze je zaznamenána na diskuzních lístcích, které jsou přílohou protokolu. Počet diskuzních lístků: 2 Komise se v závěru jednomyslně usnesla, že student splnil podmínky pro udělení akademického titulu doktor. Komise jednomyslně doporučuje, aby studentovi byla udělena cena za výjimečně kvalitní disertační práci.cs
but.jazykangličtina (English)
but.programVýpočetní technika a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorZendulka, Jaroslaven
dc.contributor.authorHon, Jiříen
dc.contributor.refereeBrejová, Bronislavaen
dc.contributor.refereeŠafránek, Daviden
dc.date.accessioned2022-11-12T07:54:27Z
dc.date.available2022-11-12T07:54:27Z
dc.date.created2022cs
dc.description.abstractEnzymy jsou proteiny urychlující chemické reakce s velkým potenciálem pro farmaceutický a obecně chemický průmysl. Enzymatická funkce je obvykle zajištěna několika nepostradatelnými aminokyselinami, které tvoří tzv. aktivní místo, kde se odehrává chemická reakce. V této práci jsou prezentovány dva integrované softwarové nástroje pro dolování a racionální výběr nových rozpustných enzymů - EnzymeMiner a SoluProt.  EnzymeMiner slouží k hledání nových enzymů. Na vstupu vyžaduje jednu nebo více sekvencí zvoleného enzymu spolu se seznamem klíčových aminokyselin. Tento seznam slouží k zvýšení pravděpodobnosti, že nalezený enzym bude mít podobnou funkci jako vstupní enzym. Výstupem EnzymeMineru je množina anotovaných sekvencí nalezených v databázi. Za účelem ulehčení výběru několika málo kandidátů pro experimentální ověření v laboratoři integruje EnzymeMiner anotace z dostupných databází - informaci o zdrojovém organismu a prostředí, ve kterém se vyskytuje, a informaci o proteinových doménách, ze kterých se enzym skládá. Hlavním kritériem pro výběr kandidátů je rozpustnost predikovaná druhým prezentovaným nástrojem, SoluProtem. SoluProt je metoda založená na strojovém učení, která predikuje heterologní rozpustnou expresi proteinu v organismu Escherichia coli . Vstupem je sekvence a výstupem je pravděpodobnost, že protein bude exprimován v rozpustné formě. SoluProt využívá model gradient boosting machine a byl trénován na datové sadě odvozené od databáze TargetTrack. Při srovnání na vyvážené nezávislé datové sadě odvozené z databáze NESG dosáhl SoluProt přesnosti 58,5 % a hodnoty AUC 0,62, čímž lehce převyšuje ostatní existující nástroje. Nástroje EnzymeMiner i SoluProt jsou často využívány řadou uživatelů z oblasti proteinového inženýrství za účelem hledání nových rozpustných biokatalyzátorů chemických reakcí. Ty mají velký potenciál snížit energetickou náročnost a ekologickou zátěž mnoha průmyslových procesů.en
dc.description.abstractEnzymes are proteins accelerating chemical reactions, which makes them attractive targets for both pharmaceutical and industrial applications. The enzyme function is mediated by several essential amino acids which form the optimal chemical environment to catalyse the reaction. In this work, two integrated bioinformatics tools for mining and rational selection of novel soluble enzymes, EnzymeMiner and SoluProt, are presented. EnzymeMiner uses one or more enzyme sequences as input along with a description of essential residues to search the protein database. The description of essential amino acids is used to increase the probability of similar enzymatic function. EnzymeMiner output is a set of annotated database hits. EnzymeMiner integrates taxonomic, environmental, and protein domain annotations to facilitate selection of promising targets for experiments. The main prioritization criterion is solubility predicted by the second tool being presented, SoluProt.  SoluProt is a machine-learning method for the prediction of soluble protein expression in Escherichia coli . The input is a protein sequence and the output is the probability of such protein to be soluble. SoluProt exploits a gradient boosting machine to decide on the output prediction class. The tool was trained on TargetTrack database. When evaluated against a balanced independent test set derived from the NESG database, SoluProt accuracy was 58.5% and its AUC 0.62, slightly exceeding those of a suite of alternative solubility prediction tools. Both EnzymeMiner and SoluProt are frequently used by the protein engineering community to find novel soluble biocatalysts for chemical reactions. These have a great potential to decrease energetic consumption and environmental burden of many industrial chemical processes.cs
dc.description.markPcs
dc.identifier.citationHON, J. Dolování rozpustných enzymů z genomických databází [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other143507cs
dc.identifier.urihttp://hdl.handle.net/11012/208537
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdolování enzymůen
dc.subjectrozpustnost proteinůen
dc.subjectproteinové inženýrstvíen
dc.subjectstrojové učeníen
dc.subjectenzyme miningcs
dc.subjectprotein solubilitycs
dc.subjectprotein engineeringcs
dc.subjectmachine-learningcs
dc.titleDolování rozpustných enzymů z genomických databázíen
dc.title.alternativeMining of soluble enzymes from genomic databasescs
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.dateAccepted2022-03-22cs
dcterms.modified2022-03-22-11:39:27cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid143507en
sync.item.dbtypeZPen
sync.item.insts2022.11.12 08:54:26en
sync.item.modts2022.11.12 08:13:51en
thesis.disciplineVýpočetní technika a informatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 5
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
10.43 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-908_s1.pdf
Size:
62.27 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-908_s1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-908_o1.pdf
Size:
36.86 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-908_o1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-908_o2.pdf
Size:
65.82 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-908_o2.pdf
Loading...
Thumbnail Image
Name:
review_143507.html
Size:
1.67 KB
Format:
Hypertext Markup Language
Description:
review_143507.html
Collections