Vyhledávání enzymů v metagenomických datech

Loading...
Thumbnail Image

Date

Authors

Smatana, Stanislav

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Hlavným cieľom tejto práce bolo navrhnúť a implementovať systém, ktorý by bol na zák- lade vstupnej sekvencie enzýmu schopný vyhľadať v metagenomickej vzorke nové enzýmy s rovnakou funkciou. Aby bolo možné garantovať, že nájdené varianty skutočne katalyzujú rovnakú reakciu, je nutné ich katalytickú funkciu bližšie overiť. Jedným z hlavných prínosov tejto práce je práve návrh, implementácia a testovanie metód pre verifikáciu katalytickej funkcie. Experimenty ukázali, že navrhnuté metódy dosahujú senzitivitu 89%, špecificitu 95%, hodnoty metriky AUC nad 0,9 a v priemere dokážu na osobnom počítači vykonať 1 203 verifikácií za sekundu. Okrem toho bola počas testovania objavená čiastočná sekven- cia nového enzýmu z rady halogénalkán dehalogenáz. Implementovaný systém je schopný fungovať na osobnom počítači, ako aj na distribuovanom systéme typu grid.
This thesis presents specification and implementation of a system for detection of enzymes in metagenomic data. The detection is based on a provided enzyme sequence and its goal is to search the metagenomic sample for its novel variants. In order to guarantee that found enzymes truly have the desired catalytic function, the system employs a number of catalytic function verification methods. Their specification, implementation and evaluation is one of the main contributions of this thesis. Experiments have shown, that proposed methods reach sensitivity as high as 89%, specificity of 95%, values of AUC metric above 0.9 and average throughput of 1,203 verifications per second on regular personal computer. Evaluation of the system also led to discovery of a partial sequence of novel haloalkane dehalogenase enzyme in a metagenomic sample from soil. The implementation is able to work on a personal computer as well as on a grid computing environment.

Description

Citation

SMATANA, S. Vyhledávání enzymů v metagenomických datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Bioinformatika a biocomputing

Comittee

prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) doc. RNDr. Aleš Horák, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)

Date of acceptance

2017-06-21

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Máte představu, které faktory nejvíce ovlivňují úspěšnost nalezení/sestavení zájmového enzymu? Dokázal by jste ohodnotit časovou a paměťovou náročnost části odpovídající vyhledávání v metagenomických datech.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO