Metody rychlého srovnání a identifikace sekvencí v metagenomických datech

but.committeeprof. Ing. Valentýna Provazník, Ph.D. (předseda) doc. RNDr. Martin Kovár, Ph.D. (místopředseda) Ing. Jan Odstrčilík, Ph.D. (člen) Ing. Jan Červený, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen)cs
but.defenceStudentka prezentovala výsledky své práce a komise byla seznámena s posudky. Prof. Provazník položil otázku: jaký statistický přístup byste zvolila pro vyhodnocení výsledků práce? Ing. Odstrčilík položil otázku: proč jsou clustery přeskupeny? Ing. Červený položil otázku: co vyjadřuje tabulka uvedená v prezentaci? Jak vysoká je přesnost klasifikace, je 89 % již dostatečně vysoká přesnost? Prof. Provazník položil otázku: chcete zachovat i míru příbuznosti organismů nebo Vám jde především o přesnost rozdělení do clusterů? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.cs
but.jazykangličtina (English)
but.programBiomedicínské inženýrství a bioinformatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSedlář, Karelen
dc.contributor.authorKupková, Kristýnaen
dc.contributor.refereeVítková, Helenaen
dc.date.created2016cs
dc.description.abstractPředmětem této práce je vytvoření metody sloužící k identifikaci organismů z metagenomických dat. Doposud k tomuto účelu spolehlivě dostačovaly metody založené na zarovnání sekvencí s referenční databází. Množství dat ovšem s rozvojem sekvenačních technik rapidně roste a tyto metody se tak stávají díky své výpočetní náročnosti nevhodnými. V této diplomové práci je popsán postup nové techniky, která umožňuje klasifikaci metagenomických dat bez nutnosti zarovnání. Metoda spočívá v převedení sekvenovaných úseků na genomické signály ve formě fázových reprezentací, ze kterých jsou následně extrahovány vektory příznaků. Těmito příznaky jsou tři Hjorthovy deskriptory. Ty jsou dále vystaveny metodě maximalizace věrohodnosti směsi Gaussovských rozložení, která umožňuje spolehlivé roztřídění fragmentů podle jejich příslušnosti k organismu.en
dc.description.abstractThe objective of this thesis is to create a method for identification of organisms in metagenomic data. Until this point methods based on sequence alignment with reference database have been sufficient for this purpose. However, the volume of data grows rapidly with evolvement of sequencing techniques and the alignment-based methods became inconvenient due to computationally demanding alignment. A new technique is introduced in this master’s thesis, which allows alignment-free metagenomic data classification. The method is based on transformation of sequences to genomic signals in form of phase representation, from which feature vectors are extracted. These features are three Hjorth descriptors, which are then subjected expectation maximization for Gaussian mixture model method allowing reliable binning of metagenomic data.cs
dc.description.markAcs
dc.identifier.citationKUPKOVÁ, K. Metody rychlého srovnání a identifikace sekvencí v metagenomických datech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.cs
dc.identifier.other93541cs
dc.identifier.urihttp://hdl.handle.net/11012/59879
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectmetagenomen
dc.subjectklasifikaceen
dc.subjectbez zarovnáníen
dc.subjectgenomický signálen
dc.subjectHjorthovy deskriptoryen
dc.subjectstrojové učeníen
dc.subjectmetagenomecs
dc.subjectbinningcs
dc.subjectalignment-freecs
dc.subjectgenomic signalcs
dc.subjectHjorth descriptorscs
dc.subjectmachine learningcs
dc.titleMetody rychlého srovnání a identifikace sekvencí v metagenomických datechen
dc.title.alternativeMethods for fast sequence comparison and identification in metagenomic datacs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-08cs
dcterms.modified2016-06-14-11:05:59cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid93541en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 13:24:32en
sync.item.modts2025.01.15 12:25:11en
thesis.disciplineBiomedicínské inženýrství a bioinformatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrstvícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.38 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
9.31 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_93541.html
Size:
5.18 KB
Format:
Hypertext Markup Language
Description:
file review_93541.html
Collections