Klasifikace biologických sekvencí s využitím bezeztrátové komprese

but.committeeprof. Ing. Valentýna Provazník, Ph.D. (předseda) doc. RNDr. Martin Kovár, Ph.D. (místopředseda) Ing. Jan Odstrčilík, Ph.D. (člen) Ing. Jan Červený, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Odstrčilík položil otázku, jestli se jedná o ztrátovou či bezeztrátovou kompresi. Doc. Kovár položil otázku, zda použité metriky jsou opravdu metriky z pohledu matematiky - zda splňují požadované vlastnosti. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.cs
but.jazykangličtina (English)
but.programBiomedicínské inženýrství a bioinformatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorVítková, Helenaen
dc.contributor.authorKruml, Ondřejen
dc.contributor.refereeProvazník, Valentýnaen
dc.date.created2016cs
dc.description.abstractTato diplomová práce se zabývá možností využití bezeztrátových kompresních algoritmů ke klasifikaci biologických sekvencí. Nejdříve je představena literární rešerše o bezeztrátových kompresních algoritmech, která byla využita k výběru slovníkového algoritmu vytvořeného A. Lempelem a J. Zivem v roce 1976 (LZ77). Tento algoritmus je běžně používán k datové kompresi a v předkládané práci byl modifikován tak, aby umožnil klasifikaci biologických sekvencí. K algoritmu byly navrženy další modifikace, které rozvíjí jeho klasifikační možnosti. V průběhu práce byla sestavena sada datasetů biologických sekvencí, která umožnila podrobné testování algoritmu. Algoritmus byl porovnán s klasickými zarovnávacími metodami: Jukes-Cantor, Tamura a Kimura. Bylo ukázáno, že algoritmus dosahuje srovnatelných výsledků v oblasti klasifikace biologických sekvencí a dokonce je u 20% datasetů překonává. Lepší výsledky dosahuje zejména u sekvencí, jež jsou si vzájemně vzdálené.en
dc.description.abstractThis master thesis is developing the idea of using lossless compression algorithms as a mean of classification of biological sequences. At first an overview of lossless data compression algorithms is presented, based on which the dictionary algorithm created by A. Lempel and J. Ziv in 1976 (LZ77) has been selected. This algorithm, that commonly serves for data compression, has been modified in order to enable the classification of biological sequences. Further modifications have been introduced to enhance the classification capabilities of the algorithm. Several datasets of biological sequences have been collected enabling a correct assessment of the LZ algorithm capability. The algorithm was compared to the classical alignment based methods: Jukes-Cantor, Tamura and Kimura. It has been proven that the algorithm has comparable results in the field of classification of biological sequences and even surpasses the alignment methods in 20% of the datasets. Best results are especially achieved with distant sequences.cs
dc.description.markAcs
dc.identifier.citationKRUML, O. Klasifikace biologických sekvencí s využitím bezeztrátové komprese [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.cs
dc.identifier.other93538cs
dc.identifier.urihttp://hdl.handle.net/11012/59960
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDatová kompreseen
dc.subjectDNAen
dc.subjectLempel-Ziven
dc.subjectLZ77en
dc.subjectfylogenetikaen
dc.subjectklasifikaceen
dc.subjectData compressioncs
dc.subjectDNAcs
dc.subjectLempel-Zivcs
dc.subjectLZ77cs
dc.subjectphylogeneticcs
dc.subjectclassificationcs
dc.titleKlasifikace biologických sekvencí s využitím bezeztrátové kompreseen
dc.title.alternativeBiological sequence classification utilizing lossless data compression algorithmscs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-07cs
dcterms.modified2016-06-10-12:57:31cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid93538en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 13:25:28en
sync.item.modts2025.01.16 00:44:45en
thesis.disciplineBiomedicínské inženýrství a bioinformatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrstvícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.57 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
832.61 KB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_93538.html
Size:
4.86 KB
Format:
Hypertext Markup Language
Description:
file review_93538.html
Collections