Vyhledávání enzymů v metagenomických datech
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Hlavným cieľom tejto práce bolo navrhnúť a implementovať systém, ktorý by bol na zák- lade vstupnej sekvencie enzýmu schopný vyhľadať v metagenomickej vzorke nové enzýmy s rovnakou funkciou. Aby bolo možné garantovať, že nájdené varianty skutočne katalyzujú rovnakú reakciu, je nutné ich katalytickú funkciu bližšie overiť. Jedným z hlavných prínosov tejto práce je práve návrh, implementácia a testovanie metód pre verifikáciu katalytickej funkcie. Experimenty ukázali, že navrhnuté metódy dosahujú senzitivitu 89%, špecificitu 95%, hodnoty metriky AUC nad 0,9 a v priemere dokážu na osobnom počítači vykonať 1 203 verifikácií za sekundu. Okrem toho bola počas testovania objavená čiastočná sekven- cia nového enzýmu z rady halogénalkán dehalogenáz. Implementovaný systém je schopný fungovať na osobnom počítači, ako aj na distribuovanom systéme typu grid.
This thesis presents specification and implementation of a system for detection of enzymes in metagenomic data. The detection is based on a provided enzyme sequence and its goal is to search the metagenomic sample for its novel variants. In order to guarantee that found enzymes truly have the desired catalytic function, the system employs a number of catalytic function verification methods. Their specification, implementation and evaluation is one of the main contributions of this thesis. Experiments have shown, that proposed methods reach sensitivity as high as 89%, specificity of 95%, values of AUC metric above 0.9 and average throughput of 1,203 verifications per second on regular personal computer. Evaluation of the system also led to discovery of a partial sequence of novel haloalkane dehalogenase enzyme in a metagenomic sample from soil. The implementation is able to work on a personal computer as well as on a grid computing environment.
This thesis presents specification and implementation of a system for detection of enzymes in metagenomic data. The detection is based on a provided enzyme sequence and its goal is to search the metagenomic sample for its novel variants. In order to guarantee that found enzymes truly have the desired catalytic function, the system employs a number of catalytic function verification methods. Their specification, implementation and evaluation is one of the main contributions of this thesis. Experiments have shown, that proposed methods reach sensitivity as high as 89%, specificity of 95%, values of AUC metric above 0.9 and average throughput of 1,203 verifications per second on regular personal computer. Evaluation of the system also led to discovery of a partial sequence of novel haloalkane dehalogenase enzyme in a metagenomic sample from soil. The implementation is able to work on a personal computer as well as on a grid computing environment.
Description
Keywords
metagenomika, enzýmy, hľadanie enzýmov, overenie katalytickej funkcie, katalytické miesto, nové enzýmy, katalytická funkcia, halogénalkán dehalogenáza, aktívne miesto, katalytické rezíduá, metagenomics, enzymes, enzyme detection, catalytic function verification, catalytic site, novel enzymes, catalytic function, haloalkane dehalogenase, active site, catalytic residues
Citation
SMATANA, S. Vyhledávání enzymů v metagenomických datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda)
doc. Ing. František Zbořil, Ph.D. (místopředseda)
Ing. Ivana Burgetová, Ph.D. (člen)
doc. RNDr. Aleš Horák, Ph.D. (člen)
Ing. Tomáš Martínek, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Date of acceptance
2017-06-21
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Máte představu, které faktory nejvíce ovlivňují úspěšnost nalezení/sestavení zájmového enzymu? Dokázal by jste ohodnotit časovou a paměťovou náročnost části odpovídající vyhledávání v metagenomických datech.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení