Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice

Loading...
Thumbnail Image

Date

Authors

Skoryk, Maksym

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta chemická

ORCID

Abstract

Náplní této diplomové práce je zkoumání a porovnání metod pro analýzu dat hmotnostní spektrometrie se zaměřením na konstruování a interpretace molekulárních sítí. Primárním cílem tohoto výzkumu je identifikace vhodných metrik shodnosti hmotnostních spekter pro vytváření molekulárních sítí, které by odhalily smysluplné vztahy mezi sloučeninami a jejich strukturními a biologickými vlastnostmi. Pro dosažení stanoveného cíle důkladně jsme prozkoumáli výkonnost různých metrik podobností hmotnostních spekter, včetně kosinové podobnosti, spektrální entropie, Spec2Vec a také Spec2Vec a MS2DeepScore založených na metodách strojového učení. Následně jsme použili techniky redukce rozměrů, jako je t-SNE, UMAP, PHATE a Isomap, abychom vizualizovali a lépe porozuměli molekulárním sítím generovaným z těchto metrik. Získané výsledky demonstrují důležitost výběru vhodných metrik podobností a jejich úpravy pro konkrétní datové sady. Tato práce přispívá k oblasti necílené hmotnostní spektrometrie a metabolomiky zkoumáním aplikací molekulárních sítí na datech elektronově-ionizační plynové chromatografií-hmotnostní spektrometrie.
This Master's thesis explores and compares methods for the analysis of mass spectrometry data, focusing on the construction and application of molecular networks. The primary objective of this study is to identify suitable mass spectra similarity metrics for the construction of molecular networks, which would reveal meaningful relationships between compounds and their structural and biological properties. To achieve this goal, we thoroughly investigated the performance of different mass spectra similarity metrics, including cosine similarity, spectral entropy, as well as machine learning-based Spec2Vec, and MS2DeepScore. We then applied dimensionality reduction techniques, such as t-SNE, UMAP, PHATE, and Isomap, to visualize and to better understand the molecular networks generated from these metrics. Our results demonstrate the importance of selecting appropriate similarity metrics and their adjustment for particular datasets and usecases. This thesis contributes to the field of untargeted mass spectrometry and metabolomics by investigating the applications of molecular networking to electron ionization gas chromatography-mass spectrometry data.

Description

Citation

SKORYK, M. Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice [online]. Brno: Vysoké učení technické v Brně. Fakulta chemická. 2023.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Chemie pro medicínské aplikace

Comittee

prof. Ing. Miloslav Pekař, CSc. (předseda) doc. Ing. Petr Dzik, Ph.D. (člen) doc. PharmDr. Ing. Radka Opatřilová, Ph.D. (člen) prof. Mgr. Martin Vala, Ph.D. (člen) prof. Ing. Stanislav Obruča, Ph.D. (místopředseda)

Date of acceptance

2023-05-23

Defence

Obhajoba diplomové práce proběhla podle následujícího schématu: prezentace studenta-vyjádření vedoucí/ho-oponentský posudek-reakce na posudek-diskuse s komisí. Student přednesl výborný výtah výsledků své práce, řádně zodpověděl všechny dotazy oponentské i členů komise, pohotově reagoval na připomínky. V diskusi tak student prokázal výbornou schopnost orientace v teoretických i praktických základech problematiky práce. Komise zhodnotila jeho práci celkově jako výbornou. Otázky vznesené během diskuse: Pekař: Už jsou studované postupy někde reálně využívány? Umíte vysvětlit příčiny, proč některé třídící metody nefungovaly? Vala: Při genomických postupech se na úvod testuje kvalita dat… existuje i ve vašich postupech nějaká vstupní kontrola kvality dat? Jakou roli hraje derivatizace a jak by mohla ovlivnit vaše třídící postupy?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO