Vyhodnocení příbuznosti organismů pomocí číslicového zpracování genomických dat
Tato dizertační práce se zabývá alternativními přístupy k analýze genetické informace organismů. V teoretické části práce jsou představeny dva odlišné přístupy vyhodnocení příbuznosti organismů na základě podobnosti jejich genetické informace obsažené v sekvenci DNA. Jedním z nich je dnes standardizovaný postup fylogenetické analýzy znakového zápisu sekvencí DNA. Přestože je tento postup poměrně výpočetně náročný kvůli potřebě mnohonásobného zarovnání DNA sekvencí, umožňuje stanovit podobnost jak globálně celých sekvencí DNA, tak lokalizovat jen konkrétní homologie v nich. Druhým přístupem jsou alternativní techniky klasifikace sekvencí DNA ve formě numerického vektoru reprezentujícího charakteristický rys obsažené genetické informace. Tyto metody označované jako „alignment-free“ umožňují velmi rychlé vyhodnocení globální podobnosti sekvencí DNA, numerickou konverzí však ztrácejí možnost vyhodnotit lokální změny v sekvencích. V praktické části je pak představena nová metoda klasifikace numerických reprezentací DNA kombinující výhody obou uvedených přístupů. Z numerických reprezentací DNA jsou zvoleny jen reprezentace mající 1D signálu podobný charakter, tzn. obsahující specifický trend vyvíjející se podél osy x. Hlavním předpokladem je taxonomická specifičnost těchto genomických signálů. Praktická část práce se zabývá vytvořením vhodných nástrojů pro číslicové zpracování genomických signálů umožňující vyhodnocení vzájemné podobnosti taxonomicky specifických trendů. Na základě vyhodnocené vzájemné podobnosti genomických signálů je provedena klasifikace formou dendrogramu, jež je obdobou fylogenetických stromů využívaných ve standardní fylogenetice.
This dissertation deals with alternative techniques for analysis of genetic information of organisms. The theoretical part presents two different approaches for evaluation of relationship between organisms based on mutual similarity of genetic information contained in their DNA sequences. The first approach is currently standardized phylogenetics analysis of character based records of DNA sequences. Although this approach is computationally expensive due to the need of multiple sequence alignment, it allows evaluation of global and local similarity of DNA sequences. The second approach is represented by techniques for classification of DNA sequences in a form of numerical vectors representing characteristic features of their genetic information. These methods known as „alignment free“ allow fast evaluation of global similarity but cannot evaluate local changes. The new method presented in this dissertation combines the advantages of both approaches. It utilizes numerical representation similar to 1D digital signal, i.e. representation that contains specific trend along x-axis. The experimental part of dissertation deals with design of a set of appropriate tools for genomic signal processing to allow evaluation mutual similarity of taxonomically specific trends. On the basis of the mutual similarity of genomic signals, the classification in the form of dendrogram is applied. It corresponds to phylogenetic trees used in standard phylogenetics.
fylogenetika, fylogenomika, numerické reprezentace, taxonomie, zarovnání sekvencí, dynamické borcení časové osy, filtrace, dentrednizace, decimace, klasifikace, phylogenetic, phylogenomic, numerical representation, taxonomy, sequence alignment, dynamic time warping, filtration, detrendisation, decimation, classification
ŠKUTKOVÁ, H. Vyhodnocení příbuznosti organismů pomocí číslicového zpracování genomických dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.
Biomedicínská elektronika a biokybernetika
