Numerické metody pro klasifikaci metagenomických dat

Loading...
Thumbnail Image

Date

Authors

Vaněčková, Tereza

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato práce se zabývá metagenomikou a výpočetními metodami využívanými pro zpracování metagenomu. Literární rešerše metod nevyžadujících zarovnání ukázala, že metody založené na studiu taxonomicky specifických četností nukleotidových slov se jeví jako vhodný a dostatečně účinný nástroj pro zpracování metagenomických čtení sekvenačních technologií nové generace. Pro vyhodnocení potenciálu těchto metod byly testovány vybrané příznaky založené na studiu četností nukleotidových slov na sadě simulovaných metagenomických čtení. Analýza byla provedena pro různou délku slov a vyhodnocena s ohledem na úspěšnost klasifikace pomocí hierarchického shlukování v originálním datovém prostoru a K-means shlukování v redukovaném datovém prostoru.
This thesis deals with metagenomics and numerical methods for classification of metagenomic data. Review of alignment-free methods based on nucleotide word frequency is provided as they appear to be effective for processing of metagenomic sequence reads produced by next-generation sequencing technologies. To evaluate these methods, selected features based on k-mer analysis were tested on simulated dataset of metagenomic sequence reads. Then the data in original data space were enrolled for hierarchical clustering and PCA processed data were clustered by K-means algorithm. Analysis was performed for different lengths of nucleotide words and evaluated in terms of classification accuracy.

Description

Citation

VANĚČKOVÁ, T. Numerické metody pro klasifikaci metagenomických dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Biomedicínské inženýrství a bioinformatika

Comittee

prof. Ing. Valentýna Provazník, Ph.D. (předseda) doc. RNDr. Martin Kovár, Ph.D. (místopředseda) Ing. Jan Odstrčilík, Ph.D. (člen) Ing. Jan Červený, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen)

Date of acceptance

2016-06-07

Defence

Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Ing. Odstrčilík položil otázku, zda se používají klasifikátory s učitelem. Prof. Provazník položil otázku: co by bylo možné dále vylepšit? Ing. Čmiel položil otázku: jakým způsobem hledáte centroidy? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO