Rekonstrukce opakujících se segmentů DNA

Loading...
Thumbnail Image

Date

Authors

Bikár, Robert

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Hlavní motivací diplomové práce bylo najít vhodný algoritmus, který by vytvořil grafovou reprezentaci NGS sekvenačních dat v lineárním čase. Zvolenou metodou pro reprezentaci je de Bruijnův graf. V další části práce byl navrhnut nástroj, který je schopen transformovat graf do přijatelné podoby pro vykreslování, a dále je schopen odstraňovat chyby, které vznikají při konstrukci grafu. Cílem práce je vytvořit nástroj, který rekonstruuje repetitivní segmenty v DNA. Implementovaný nástroj byl otestován a je schopen identifikovat opakující se segmenty, určit jejich typy, vizualizovat je a sestavit jejich sekvenci na jednodušších genomech s velkou přesnotí. Při použití složitějších genomů, nástroj nalezne pouze fragmenty repetitivních segmentů.
The main motivation for master's thesis is to find suitable algorithm that creates a graph representation of NGS sequencing data in linear time. De Bruijn graph was chosen as a method for research. Next, the tool was designed to be able to transform the graph and correct errors created during construction of the graph. The main aim of the thesis is to implement a tool that reconstructs repetitive segments in DNA. Implemented tool was tested and is able to  identify repetitive segments, specify types, visualize them properly and is also able to assemble their sequence with fine accuracy on simpler genomes. When using complex genomes, tool is able to reconstruct only fragments of repetitive segments.

Description

Citation

BIKÁR, R. Rekonstrukce opakujících se segmentů DNA [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Bioinformatika a biocomputing

Comittee

prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Jan Platoš, Ph.D. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)

Date of acceptance

2016-06-20

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: 1) Pokud uznáte za vhodné, reagujte prosím na bod 5. 2) V práci je použita osvědčená a v tomto případě snad jediná možná metoda ověření spolehlivosti algoritmu, resp. jeho implementace, a sice analýza umělých dat, se známým počtem repetic ve formátu co nejpodobnějším reálným datům. Z přečteného mám dojem, že tyto syntetické data neobsahovali repetice v přirozeném spektru jejich variability, ale počítali jenom s omezeným počtem repetic a variabilitou způsobenou chybami v sekvenaci. To může vést k nadhodnocení kvality výpočtu oproti tomu, co by se dělo v datech s reálnými repeticemi, které se často liší od sebe v desítkách procent nukleotidů, i když patří do stejné rodiny, či jiné evolučně příbuzné skupiny. Reagujte prosím potvrzením nebo vyvrácením této zkutečnosti, zkušenostmi s programem v tomto směru nebo návrhy pro nápravu.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO