Machine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic data

but.defenceStudent prezentoval svou diplomovou práci, seznámil komisi s výsledky své práce a zodpověděl dotazy členů komise.cs
but.jazykangličtina (English)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMehnen, Larsen
dc.contributor.authorKoban, Martinen
dc.contributor.refereePhD, Florian Halbritter,en
dc.date.created2020cs
dc.description.abstractS rozvojom techník pre efektívnu akvizíciu genomických dát sa jednou z kľúčových vedeckých výziev stala interpretácia výsledkov týchto experimentov v zmysluplnom biologickom kontexte. Táto práca sa zameriava na využitie informácií ukrytých v dobre charakterizovaných transkriptomických a epigenomických dátach z verejne dostupných zdrojov pre účely takejto interpretácie. Najskôr je vytvorený integrovaný súbor dát generovaných metódami DNase-seq a ATAC-seq, ktoré kvantifikujú chromatínovú dostupnosť. Tieto údaje sú doplnené verejne dostupnými výsledkami techniky RNA-seq pre kvantitatívne hodnotenie génovej expresie a vhodne predspracované pre ďalšiu analýzu. Pripravené dáta sú následne použité na trénovanie modelov strojového učenia (klasifikátorov) s dvomi základnými cieľmi. Po prvé za účelom augmentácie metadát prislúchajúcich k jednotlivým biologickým vzorkám v trénovacom dátovom súbore pomocou predikcie nedefinovaných anotácií. Po druhé pre anotáciu zle charakterizovaných testovacích dát (nepoužitých v trénovacej fáze) za účelom overenia generalizačnej schopnosti zostavených modelov. Dosiahnuté výsledky ukazujú, že natrénované klasifikátory sú schopné zachytiť biologicky relevantné informácie, zatiaľ čo vplyv technických artefaktov je minimalizovaný. Navrhnutý prístup je preto schopný prispieť k lepšiemu pochopeniu komplexných transkriptomických a epigenomických dát, predovšetkým v oblasti onkologického výskumu.en
dc.description.abstractSince the advent of techniques capable of rapid acquisition of genomic data, it is one of the key challenges for researchers to interpret the results of such experiments in meaningful biological terms. In this work, we aim to exploit knowledge hidden in well-characterised transcriptomic and epigenomic data from publicly available sources to aid this interpretation. An integrated resource of chromatin accessibility data (from DNase-seq and ATAC-seq experiments) was created and pre-processed for downstream analyses, complemented by collections of public gene expression (RNA-seq) profiles. These datasets were used for training machine learning classifiers with two primary purposes. Firstly, for augmenting sample annotations by predicting undefined metadata labels in the training datasets. Secondly, for annotation of poorly characterised, unseen data to examine generalisation ability of the constructed models. We demonstrated that biologically relevant information was captured by the trained classifiers while technical artefacts were minimised. Thus, we validated that the proposed supervised machine learning approach can contribute to clarifying contents of cryptic transcriptomic and epigenomic datasets, particularly from the field of cancer research.cs
dc.description.markBcs
dc.identifier.citationKOBAN, M. Machine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic data [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.cs
dc.identifier.other123273cs
dc.identifier.urihttp://hdl.handle.net/11012/195467
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectstrojové učenieen
dc.subjectchromatínová dostupnosťen
dc.subjectgénová expresiaen
dc.subjectmetadátaen
dc.subjectklasifikáciaen
dc.subjectrakovinaen
dc.subjectmachine learningcs
dc.subjectchromatin accessibilitycs
dc.subjectgene expressioncs
dc.subjectmetadatacs
dc.subjectclassificationcs
dc.subjectcancercs
dc.titleMachine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic dataen
dc.title.alternativeMachine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic datacs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2020-09-25cs
dcterms.modified2020-10-21-09:59:51cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid123273en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:26:07en
sync.item.modts2025.01.17 10:36:10en
thesis.disciplineBiomedicínské a ekologické inženýrstvícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrstvícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
11.69 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-beurteilung_Koban.pdf
Size:
870.9 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-beurteilung_Koban.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-MasterThesisAssessment2AssessorKoban.pdf
Size:
171.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-MasterThesisAssessment2AssessorKoban.pdf
Loading...
Thumbnail Image
Name:
review_123273.html
Size:
1.85 KB
Format:
Hypertext Markup Language
Description:
file review_123273.html
Collections