Komprese genomických signálů pro klasifikaci a identifikaci organismů
Loading...
Date
Authors
Sedlář, Karel
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Moderní klasifikace organismů je založena na molekulárních datech. Přitom tyto metody spoléhají na vícenásobné zarovnání znakových sekvencí, což je činí výpočetně velmi náročnými. Proto je také možné zpracovávat pouze krátké úseky genomu. Tato práce ukazuje zcela nový algoritmus postavený na konverzi celogenomových sekvencí do signálů kumulované fáze. Ty jsou podrobeny ztrátové kompresi spočívající v odstranění nadbytečných frekvenčních pásem pomocí vlnkové transformace. Klasifikace organismů je následně provedena jako shluková analýza s využitím euklidovské vzdálenosti dvojic komprimovaných signálů, kde je zarovnání provedeno algoritmem pro dynamické borcení časové osy.
Modern classification of organisms is performed on molecular data. These methods rely on multiple alignment of sequences of characters which make them computationally demanding. Only small parts of genomes can be compared in reasonable time. In this paper, the novel algorithm based on conversion of the whole genome sequences to cumulative phase signals is presented. Dyadic wavelet transform is used for lossy compression of signals by redundant frequency bands elimination. Signal classification is then performed as a cluster analysis using Euclidian metrics where multiple alignment is replaced by dynamic time warping.
Modern classification of organisms is performed on molecular data. These methods rely on multiple alignment of sequences of characters which make them computationally demanding. Only small parts of genomes can be compared in reasonable time. In this paper, the novel algorithm based on conversion of the whole genome sequences to cumulative phase signals is presented. Dyadic wavelet transform is used for lossy compression of signals by redundant frequency bands elimination. Signal classification is then performed as a cluster analysis using Euclidian metrics where multiple alignment is replaced by dynamic time warping.
Description
Citation
SEDLÁŘ, K. Komprese genomických signálů pro klasifikaci a identifikaci organismů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Biomedicínské inženýrství a bioinformatika
Comittee
prof. Ing. Valentýna Provazník, Ph.D. (předseda)
doc. Ing. Jiří Rozman, CSc. (místopředseda)
Ing. Martin Vítek, Ph.D. (člen)
RNDr. Petr Fuchs, Ph.D. (člen)
prof. Pharm.Dr. Petr Babula, Ph.D. (člen)
Date of acceptance
2013-06-11
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení