Metody pro predikci s vysokodimenzionálními daty genových expresí

but.jazykangličtina (English)
but.programVýpočetní technika a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelen
dc.contributor.authorŠilhavá, Janaen
dc.contributor.refereeMatula, Petren
dc.contributor.refereeŽelezný, Filipen
dc.date.accessioned2021-11-22T22:18:29Z
dc.date.available2021-11-22T22:18:29Z
dc.date.createdcs
dc.description.abstractDizertační práce se zabývá predikcí vysokodimenzionálních dat genových expresí. Množství dostupných genomických dat významně vzrostlo v průběhu posledního desetiletí. Kombinování dat genových expresí s dalšími daty nachází uplatnění v mnoha oblastech. Například v klinickém řízení rakoviny (clinical cancer management) může přispět k přesnějšímu určení prognózy nemocí. Hlavní část této dizertační práce je zaměřena na kombinování dat genových expresí a klinických dat. Používáme logistické regresní modely vytvořené prostřednictvím různých regularizačních technik. Generalizované lineární modely umožňují kombinování modelů s různou strukturou dat. V dizertační práci je ukázáno, že kombinování modelu dat genových expresí a klinických dat může vést ke zpřesnění výsledku predikce oproti vytvoření modelu pouze z dat genových expresí nebo klinických dat. Navrhované postupy přitom nejsou výpočetně náročné.  Testování je provedeno nejprve se simulovanými datovými sadami v různých nastaveních a následně s~reálnými srovnávacími daty. Také se zde zabýváme určením přídavné hodnoty microarray dat. Dizertační práce obsahuje porovnání příznaků vybraných pomocí klasifikátoru genových expresí na pěti různých sadách dat týkajících se rakoviny prsu. Navrhujeme také postup výběru příznaků, který kombinuje data genových expresí a znalosti z genových ontologií.en
dc.description.abstractThis thesis deals with class prediction with high-dimensional gene expression data. During the last decade, an increasing amount of genomic data has become available. Combining gene expression data with other data can be useful in clinical management, where it can improve the prediction of disease prognosis. The main part of this thesis is aimed at combining gene expression data with clinical data. We use logistic regression models that can be built through various regularized techniques. Generalized linear models enable us to combine models with different structure of data. It is shown that such a combination may yield more accurate predictions than those obtained based on the use of gene expression or clinical data alone. Suggested approaches are not computationally intensive. Evaluations are performed with simulated data sets in different settings and then with real benchmark data sets. The work also characterizes an additional predictive value of microarrays. The thesis includes a comparison of selected features of gene expression classifiers built up in five different breast cancer data sets. Finally, a feature selection that combines gene expression data with gene ontology information is proposed.cs
dc.description.markPcs
dc.identifier.citationŠILHAVÁ, J. Metody pro predikci s vysokodimenzionálními daty genových expresí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other99795cs
dc.identifier.urihttp://hdl.handle.net/11012/63225
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectpredictive classificationcs
dc.subjectgeneralized linear modelscs
dc.subjectboostingcs
dc.subjectlogistic regressioncs
dc.subjectelastic netcs
dc.subjectmodel evaluationcs
dc.subjecthigh-dimensional datacs
dc.subjectcombining of heterogenous datacs
dc.subjectfeature selectioncs
dc.subjectDNA microarray datacs
dc.subjectgene expressioncs
dc.subjectclinical datacs
dc.subjectgene ontologycs
dc.subjectprediktivní klasifikaceen
dc.subjectgeneralizované lineární modelyen
dc.subjectboostingen
dc.subjectlogistická regreseen
dc.subjectelastická síťen
dc.subjectvyhodnocování modeluen
dc.subjectvysokodimensionální dataen
dc.subjectkombinování heterogenních daten
dc.subjectvýběr příznakůen
dc.subjectDNA microarray dataen
dc.subjectgenové expreseen
dc.subjectklinická dataen
dc.subjectgenové ontologieen
dc.titleMetody pro predikci s vysokodimenzionálními daty genových expresíen
dc.title.alternativeMethods for class prediction with high-dimensional gene expression datacs
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.modified2020-05-10-17:46:39cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid99795en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 23:18:29en
sync.item.modts2021.11.22 22:37:23en
thesis.disciplineVýpočetní technika a informatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 6
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.59 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
thesis-1.pdf
Size:
185.06 KB
Format:
Adobe Portable Document Format
Description:
thesis-1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-226_s1.pdf
Size:
449.71 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-226_s1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-226_o1.pdf
Size:
210.64 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-226_o1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-226_o2.pdf
Size:
53.23 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-226_o2.pdf
Collections