Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice

Loading...
Thumbnail Image
Date
Authors
Skoryk, Maksym
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta chemická
Abstract
Náplní této diplomové práce je zkoumání a porovnání metod pro analýzu dat hmotnostní spektrometrie se zaměřením na konstruování a interpretace molekulárních sítí. Primárním cílem tohoto výzkumu je identifikace vhodných metrik shodnosti hmotnostních spekter pro vytváření molekulárních sítí, které by odhalily smysluplné vztahy mezi sloučeninami a jejich strukturními a biologickými vlastnostmi. Pro dosažení stanoveného cíle důkladně jsme prozkoumáli výkonnost různých metrik podobností hmotnostních spekter, včetně kosinové podobnosti, spektrální entropie, Spec2Vec a také Spec2Vec a MS2DeepScore založených na metodách strojového učení. Následně jsme použili techniky redukce rozměrů, jako je t-SNE, UMAP, PHATE a Isomap, abychom vizualizovali a lépe porozuměli molekulárním sítím generovaným z těchto metrik. Získané výsledky demonstrují důležitost výběru vhodných metrik podobností a jejich úpravy pro konkrétní datové sady. Tato práce přispívá k oblasti necílené hmotnostní spektrometrie a metabolomiky zkoumáním aplikací molekulárních sítí na datech elektronově-ionizační plynové chromatografií-hmotnostní spektrometrie.
This Master's thesis explores and compares methods for the analysis of mass spectrometry data, focusing on the construction and application of molecular networks. The primary objective of this study is to identify suitable mass spectra similarity metrics for the construction of molecular networks, which would reveal meaningful relationships between compounds and their structural and biological properties. To achieve this goal, we thoroughly investigated the performance of different mass spectra similarity metrics, including cosine similarity, spectral entropy, as well as machine learning-based Spec2Vec, and MS2DeepScore. We then applied dimensionality reduction techniques, such as t-SNE, UMAP, PHATE, and Isomap, to visualize and to better understand the molecular networks generated from these metrics. Our results demonstrate the importance of selecting appropriate similarity metrics and their adjustment for particular datasets and usecases. This thesis contributes to the field of untargeted mass spectrometry and metabolomics by investigating the applications of molecular networking to electron ionization gas chromatography-mass spectrometry data.
Description
Citation
SKORYK, M. Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice [online]. Brno: Vysoké učení technické v Brně. Fakulta chemická. 2023.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Chemie pro medicínské aplikace
Comittee
prof. Ing. Miloslav Pekař, CSc. (předseda) doc. Ing. Petr Dzik, Ph.D. (člen) doc. PharmDr. Ing. Radka Opatřilová, Ph.D. (člen) prof. Mgr. Martin Vala, Ph.D. (člen) prof. Ing. Stanislav Obruča, Ph.D. (místopředseda)
Date of acceptance
2023-05-23
Defence
Obhajoba diplomové práce proběhla podle následujícího schématu: prezentace studenta-vyjádření vedoucí/ho-oponentský posudek-reakce na posudek-diskuse s komisí. Student přednesl výborný výtah výsledků své práce, řádně zodpověděl všechny dotazy oponentské i členů komise, pohotově reagoval na připomínky. V diskusi tak student prokázal výbornou schopnost orientace v teoretických i praktických základech problematiky práce. Komise zhodnotila jeho práci celkově jako výbornou. Otázky vznesené během diskuse: Pekař: Už jsou studované postupy někde reálně využívány? Umíte vysvětlit příčiny, proč některé třídící metody nefungovaly? Vala: Při genomických postupech se na úvod testuje kvalita dat… existuje i ve vašich postupech nějaká vstupní kontrola kvality dat? Jakou roli hraje derivatizace a jak by mohla ovlivnit vaše třídící postupy?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO