Identifikace genů ve squigglech ze sekvenace nanopórem
Loading...
Date
Authors
Talanin, Nikita
Advisor
Referee
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Sekvenace nanopórem je nová a rychle se rozvíjející technologie, která umožňuje přímé sekvenování jednovláknové DNA a RNA v reálném čase. Výsledkem sekvenace je takzvaný squiggle, což je časová řada intenzit proudů při průchodu nukleotidů nanopórem. Identifikace genů v těchto squigglech je klíčovým krokem pro využití těchto dat v genomických studiích. Tato bakalářská práce se zabývá vývojem a testováním metody pro automatickou identifikaci genů ve squigglech ze sekvenace nanopórem. Cílem bylo vytvořit systém, který by mohl rychle a přesně identifikovat geny v squigglech, a tím podpořit další analýzy a interpretaci dat z nanopórové sekvenace. Metoda využívá konvoluční neuronové sítě (CNN), které byly úspěšně použity v mnoha jiných oblastech bioinformatiky. Pro trénování modelu byl použit velký dataset squigglů, které byly označeny podle genu, který reprezentují. Výsledky ukazují, že systém je schopen s určitou přesností identifikovat geny ve squigglech a že může být účinným nástrojem pro analýzu dat z nanopórové sekvenace.
Nanopore sequencing is a new and rapidly developing technology that allows for the direct sequencing of single-stranded DNA and RNA in real-time. The result of the sequencing is the so-called squiggle, which is a time series of current intensities as nucleotides pass through the nanopore. Identifying genes in these squiggles is a crucial step for the utilization of this data in genomic studies. This bachelor's thesis focuses on the development and testing of a method for automatic gene identification in squiggles from nanopore sequencing. The aim was to create a system capable of quickly and accurately identifying genes in squiggles, thereby supporting further analysis and interpretation of nanopore sequencing data. The method utilizes Convolutional Neural Networks (CNN), which have been successfully used in many other areas of bioinformatics. A large dataset of squiggles, labeled according to the gene they represent, was used to train the model. The results show that the system can identify genes in squiggles with a certain level of accuracy and can be an effective tool for nanopore sequencing data analysis
Nanopore sequencing is a new and rapidly developing technology that allows for the direct sequencing of single-stranded DNA and RNA in real-time. The result of the sequencing is the so-called squiggle, which is a time series of current intensities as nucleotides pass through the nanopore. Identifying genes in these squiggles is a crucial step for the utilization of this data in genomic studies. This bachelor's thesis focuses on the development and testing of a method for automatic gene identification in squiggles from nanopore sequencing. The aim was to create a system capable of quickly and accurately identifying genes in squiggles, thereby supporting further analysis and interpretation of nanopore sequencing data. The method utilizes Convolutional Neural Networks (CNN), which have been successfully used in many other areas of bioinformatics. A large dataset of squiggles, labeled according to the gene they represent, was used to train the model. The results show that the system can identify genes in squiggles with a certain level of accuracy and can be an effective tool for nanopore sequencing data analysis
Description
Citation
TALANIN, N. Identifikace genů ve squigglech ze sekvenace nanopórem [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
bez specializace
Comittee
prof. Ing. Martin Augustynek, Ph.D. (předseda)
Ing. Martin Mézl, Ph.D. (místopředseda)
MUDr. Tibor Stračina, Ph.D. (člen)
Ing. Markéta Jakubíčková, Ph.D. (člen)
Ing. Martin Králík (člen)
Ing. Radovan Smíšek, Ph.D. (člen)
Date of acceptance
2023-06-14
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Nykrýnová položila otázku jak by model pracoval, pokud by byl na vstup přiveden delší signál. Jak byl vytvořen dataset, byly zahrnuty i signály bez genu? Jak bylo provedeno vyhodnocení úšpěšnosti sítě? Máte zjištěné, jak síť detekovala jednotlivé geny? Dr. Mézl položil otázku na čem byla síť trénována? Student odpověděl na otázky členů komise a oponenta. Student neobhájil bakalářskou práci. K bakalářské práci je potřeba dopracovat praktickou část a dopsat diskuzi.
Result of defence
práce nebyla úspěšně obhájena
