Využití technik strojového učení pro detekci a klasifikaci genů v surových nanopórových signálech

but.committeedoc. Ing. Petr Kudrna, Ph.D. (předseda) doc. Ing. Jana Kolářová, Ph.D. (místopředseda) MUDr. Zuzana Nováková, Ph.D. (člen) Ing. Kateřina Šabatová (člen) Ing. Marina Filipenská, Ph.D. (člen) Ing. Daniel Barvík, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena sposudky. Doc. Kudrna položil otázku na možnosti zkrácení času a finanční úspory analýzy. Ing. Filipenská položila otázku ohledně novosti použité metodiky. Ing. Šabatová položila otázku na rozšíření práce v budoucnosti. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.cs
but.jazykčeština (Czech)
but.programBiomedicínská technika a bioinformatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorVítková, Helenacs
dc.contributor.authorVorochta, Jevhenijcs
dc.contributor.refereeFilipenská, Marinacs
dc.date.created2025cs
dc.description.abstractTato bakalářská práce se zabývá aplikací metod strojového učení na detekci a klasifikaci genů v surových nanopórových signálech. Jejím hlavním cílem bylo vyvinout model neuronové sítě schopný rychlé a spolehlivé detekce genů, včetně genů rezistence vůči antibiotikům. V úvodu je podrobně rozebrán princip nanopórového sekvenování, včetně jeho výhod a omezení, a dále jsou nastíněny běžné formáty pro ukládání výstupních dat (FAST5, POD5). Následně je popsána teorie neuronových sítí a později jsou představeny architektury dvou neuronových sítí. První je převzatá transformerová síť původně používaná pro klasifikaci EKG signálů a druhá je vlastní hybridní konvoluční-transformerová síť. V praktické části byl z reálných sekvenačních dat z platformy Oxford Nanopore vybrán a sestaven dataset s několika geny rezistence. Poté proběhlo trénování a ladění převzaté a vlastní neuronové sítě, přičemž hlavními metrikami hodnocení byly přesnost, F1 skóre a matice záměn. Z dosažených výsledků vyplynulo, že vlastní hybridní model dosahuje mnohem lepších výsledků oproti převzatému. Jeho úspěšnost dosahuje 89,44 % při klasifikaci do čtyř tříd (tři různé geny a žádný gen). Ve srovnání s tradičním přístupem je použití této metody k určení přítomnosti vybraných genů, které vyvolávají rezistenci vůči antibiotikům, minimálně o 66,7 % rychlejší. Využití strojového učení a neuronových sítí pro přímou detekci genů v surových nanopórových signálech je proveditelné a otevírá široké možnosti v oblasti rychlé diagnostiky i výzkumu. Další zdokonalování se může zaměřit na optimalizaci modelu, použití rozsáhlejších a různorodějších dat, nebo také použití statistických metod ke zvýšení úspěšnosti.cs
dc.description.abstractThis bachelor thesis deals with the application of machine learning methods for gene detection and classification in raw nanopore signals. Its main goal is to develop a neural network model capable of quick and reliable identification of genes, including antibiotic resistance genes. In the introduction, the principle of nanopore sequencing was discussed in detail, including its advantages and limitations, and common output data storage formats (FAST5, POD5) were outlined. Subsequently, the concepts of neural networks were described and later the architectures of two neural networks were presented. The first is an adopted transformer model formerly used for ECG signal classification and the second is a custom hybrid convolutional-transformer model. In the practical part, a dataset with several resistance genes was selected and constructed from real sequencing data from the Oxford Nanopore platform. Training and tuning of the adopted and custom neural network was then performed, with accuracy, F1 score and confusion matrix as the main evaluation metrics. The results showed that the custom hybrid model performed much better than the adopted one. Its success rate is 89,44 % when classifying into four categories (three different genes and no gene). Compared to the traditional approach, using this method for the detection of chosen antibiotic resistance genes is at least 66,7 % faster. The use of machine learning and neural networks for direct detection of genes in raw nanopore signals is feasible and opens up a wide range of possibilities in rapid diagnostics and research. Further improvements may focus on model optimization, using larger and more diverse data, or using statistical methods to increase success rates.en
dc.description.markAcs
dc.identifier.citationVOROCHTA, J. Využití technik strojového učení pro detekci a klasifikaci genů v surových nanopórových signálech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.cs
dc.identifier.other167507cs
dc.identifier.urihttp://hdl.handle.net/11012/253012
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectNanopórové sekvenovánícs
dc.subjectstrojové učenícs
dc.subjectneuronová síťcs
dc.subjecttransformerycs
dc.subjectkonvoluční sítěcs
dc.subjectklasifikace signálůcs
dc.subjectgenová rezistencecs
dc.subjectsekvenační datacs
dc.subjectbioinformatikacs
dc.subjectgenomikacs
dc.subjectantibiotická rezistence.cs
dc.subjectNanopore sequencingen
dc.subjectmachine learningen
dc.subjectneural networken
dc.subjecttransformersen
dc.subjectconvolutional networksen
dc.subjectsignal classificationen
dc.subjectgene resistanceen
dc.subjectsequencing dataen
dc.subjectbioinformaticsen
dc.subjectgenomicsen
dc.subjectantibiotic resistance.en
dc.titleVyužití technik strojového učení pro detekci a klasifikaci genů v surových nanopórových signálechcs
dc.title.alternativeUsing machine learning techniques for gene detection and classification in raw nanopore signalsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-17cs
dcterms.modified2025-06-19-09:42:44cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid167507en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 20:04:42en
sync.item.modts2025.08.26 19:50:53en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrstvícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.23 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
30.45 KB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
review_167507.html
Size:
7.05 KB
Format:
Hypertext Markup Language
Description:
file review_167507.html

Collections