Klasifikace biologických sekvencí s využitím bezeztrátové komprese
but.committee | prof. Ing. Valentýna Provazník, Ph.D. (předseda) doc. RNDr. Martin Kovár, Ph.D. (místopředseda) Ing. Jan Odstrčilík, Ph.D. (člen) Ing. Jan Červený, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen) | cs |
but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Odstrčilík položil otázku, jestli se jedná o ztrátovou či bezeztrátovou kompresi. Doc. Kovár položil otázku, zda použité metriky jsou opravdu metriky z pohledu matematiky - zda splňují požadované vlastnosti. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. | cs |
but.jazyk | angličtina (English) | |
but.program | Biomedicínské inženýrství a bioinformatika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Vítková, Helena | en |
dc.contributor.author | Kruml, Ondřej | en |
dc.contributor.referee | Provazník, Valentýna | en |
dc.date.created | 2016 | cs |
dc.description.abstract | Tato diplomová práce se zabývá možností využití bezeztrátových kompresních algoritmů ke klasifikaci biologických sekvencí. Nejdříve je představena literární rešerše o bezeztrátových kompresních algoritmech, která byla využita k výběru slovníkového algoritmu vytvořeného A. Lempelem a J. Zivem v roce 1976 (LZ77). Tento algoritmus je běžně používán k datové kompresi a v předkládané práci byl modifikován tak, aby umožnil klasifikaci biologických sekvencí. K algoritmu byly navrženy další modifikace, které rozvíjí jeho klasifikační možnosti. V průběhu práce byla sestavena sada datasetů biologických sekvencí, která umožnila podrobné testování algoritmu. Algoritmus byl porovnán s klasickými zarovnávacími metodami: Jukes-Cantor, Tamura a Kimura. Bylo ukázáno, že algoritmus dosahuje srovnatelných výsledků v oblasti klasifikace biologických sekvencí a dokonce je u 20% datasetů překonává. Lepší výsledky dosahuje zejména u sekvencí, jež jsou si vzájemně vzdálené. | en |
dc.description.abstract | This master thesis is developing the idea of using lossless compression algorithms as a mean of classification of biological sequences. At first an overview of lossless data compression algorithms is presented, based on which the dictionary algorithm created by A. Lempel and J. Ziv in 1976 (LZ77) has been selected. This algorithm, that commonly serves for data compression, has been modified in order to enable the classification of biological sequences. Further modifications have been introduced to enhance the classification capabilities of the algorithm. Several datasets of biological sequences have been collected enabling a correct assessment of the LZ algorithm capability. The algorithm was compared to the classical alignment based methods: Jukes-Cantor, Tamura and Kimura. It has been proven that the algorithm has comparable results in the field of classification of biological sequences and even surpasses the alignment methods in 20% of the datasets. Best results are especially achieved with distant sequences. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | KRUML, O. Klasifikace biologických sekvencí s využitím bezeztrátové komprese [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016. | cs |
dc.identifier.other | 93538 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/59960 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Datová komprese | en |
dc.subject | DNA | en |
dc.subject | Lempel-Ziv | en |
dc.subject | LZ77 | en |
dc.subject | fylogenetika | en |
dc.subject | klasifikace | en |
dc.subject | Data compression | cs |
dc.subject | DNA | cs |
dc.subject | Lempel-Ziv | cs |
dc.subject | LZ77 | cs |
dc.subject | phylogenetic | cs |
dc.subject | classification | cs |
dc.title | Klasifikace biologických sekvencí s využitím bezeztrátové komprese | en |
dc.title.alternative | Biological sequence classification utilizing lossless data compression algorithms | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2016-06-07 | cs |
dcterms.modified | 2016-06-10-12:57:31 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 93538 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 13:25:28 | en |
sync.item.modts | 2025.01.16 00:44:45 | en |
thesis.discipline | Biomedicínské inženýrství a bioinformatika | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrství | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.57 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- review_93538.html
- Size:
- 4.86 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_93538.html