Komplexní architektury neuronových sítí pro efektivní generalizaci nestrukturovaných dat
Loading...
Date
Authors
Mezina, Anzhelika
ORCID
Advisor
Referee
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Umělá inteligence způsobila revoluci v odvětvích, jako je zpracování obrazu, zpracování přirozeného jazyka a analýza dat. Nedávné pokroky také významně ovlivnily lékařské zobrazování tím, že algoritmy umělé inteligence dokázaly s velkou přesností odhalit nemoci, jako je rakovina z rentgenových snímků, což urychlilo diagnostiku a zlepšilo výsledky léčby. Stále však existuje zásadní problém: neschopnost efektivně se učit z omezených zdrojů dat, zejména v lékařském výzkumu, kde jsou běžné anomálie a dříve nezaznamenané případy. Tato práce zkoumá využití neuronových sítí ve dvou vzájemně propojených oblastech budoucích inteligentních systémů: lékařském výzkumu a telekomunikacích. Zkoumá použití komplexních neuronových sítí s malým množstvím lékařských dat a vývoj neuronových sítí pro analýzu telekomunikačních sítí. Hlavním přínosem práce je návrh architektur komplexních neuronových sítí schopných efektivnějšího učení i z omezených zdrojů dat. Tato studie se zaměřuje na efektivitu a schopnost zobecnění NN a metod strojového učení (ML) při práci s malými soubory dat. Zabývá se také výzvami při použití NN předem natrénovaných na velkých souborech dat a následně doladěných. Dále zkoumá přizpůsobivost těchto metod pro integraci do rozhodovacích systémů a zdůrazňuje jejich potenciál pro praktické aplikace. K vyhodnocení přesnosti predikce navržených architektur NN byly použity dva reálné scénáře. V prvním scénáři jsou komplexní NN využity k posouzení účinnosti léčby kortikosteroidy u pacientů v nemocničním prostředí. Výsledky ukazují, že navržený přístup umožňuje dosáhnout přesnosti 80%. Jedná se o první práci v této oblasti výzkumu. Druhý scénář zahrnuje vývoj architektur neuronových sítí k analýze síťového provozu, konkrétně se zaměřením na identifikaci potenciálních kybernetických incidentů a monitorování provozu darknetu. Na rozdíl od jiných přístupů byly v navrhovaných přístupech použity principy sémantické segmentace, které jsou přizpůsobeny pro analýzu síťového provozu. Výsledkem je, že navržené metodiky překonávají nejmodernější přístupy.
Artificial Intelligence (AI) has revolutionized sectors like image processing, natural language processing, and data analysis. Recent advancements have also significantly impacted medical imaging by enabling AI algorithms to detect diseases such as cancer from radiographic images with impressive accuracy, accelerating diagnosis and improving treatment outcomes. However, a critical issue remains: the inability to effectively learn from limited data sources, particularly in medical research, where anomalies and previously unseen cases are common. This thesis explores the application of Neural Networks (NNs) in two interconnected domains of future smart systems: medical research and telecommunications. It investigates the use of complex NNs with small medical datasets and the development of NNs for telecommunications network analysis. The thesis’s main contribution is the development of innovative NN architectures capable of more efficient learning even from limited data sources. The research focuses on the efficiency and generalization ability of NNs and Machine Learning (ML) methods when working with small datasets. It also addresses the challenges of applying NNs pretrained on large datasets and subsequently fine-tuned. Furthermore, it explores the adaptability of these methods for integration into decision-making systems, highlighting their potential for practical applications. Two real-world scenarios have been used to evaluate the predictive accuracy of the proposed NN architectures. In the first scenario, complex NNs are utilized to assess the effectiveness of corticosteroid treatment for patients in a hospital setting. The results show that the proposed approach allows for an accuracy of 80%. This is the first work in this field of research. The second scenario involves the development of NN architectures to analyze network traffic, specifically focusing on identifying potential cyber incidents and monitoring darknet traffic. In contrast to other approaches, the proposed ones applied the principles of semantic segmentation, which are adapted for network traffic analysis. In a result, the proposed methodologies outperform state-of-the-art approaches.
Artificial Intelligence (AI) has revolutionized sectors like image processing, natural language processing, and data analysis. Recent advancements have also significantly impacted medical imaging by enabling AI algorithms to detect diseases such as cancer from radiographic images with impressive accuracy, accelerating diagnosis and improving treatment outcomes. However, a critical issue remains: the inability to effectively learn from limited data sources, particularly in medical research, where anomalies and previously unseen cases are common. This thesis explores the application of Neural Networks (NNs) in two interconnected domains of future smart systems: medical research and telecommunications. It investigates the use of complex NNs with small medical datasets and the development of NNs for telecommunications network analysis. The thesis’s main contribution is the development of innovative NN architectures capable of more efficient learning even from limited data sources. The research focuses on the efficiency and generalization ability of NNs and Machine Learning (ML) methods when working with small datasets. It also addresses the challenges of applying NNs pretrained on large datasets and subsequently fine-tuned. Furthermore, it explores the adaptability of these methods for integration into decision-making systems, highlighting their potential for practical applications. Two real-world scenarios have been used to evaluate the predictive accuracy of the proposed NN architectures. In the first scenario, complex NNs are utilized to assess the effectiveness of corticosteroid treatment for patients in a hospital setting. The results show that the proposed approach allows for an accuracy of 80%. This is the first work in this field of research. The second scenario involves the development of NN architectures to analyze network traffic, specifically focusing on identifying potential cyber incidents and monitoring darknet traffic. In contrast to other approaches, the proposed ones applied the principles of semantic segmentation, which are adapted for network traffic analysis. In a result, the proposed methodologies outperform state-of-the-art approaches.
Description
Citation
MEZINA, A. Komplexní architektury neuronových sítí pro efektivní generalizaci nestrukturovaných dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
bez specializace
Comittee
prof. Ing. Jaroslav Koton, Ph.D. (předseda)
prof. Ing. Zdeněk Smékal, CSc. (člen)
prof. RNDr. Václav Matyáš, M.Sc. (člen)
doc. Ing. Kamil Říha, Ph.D. (člen)
doc. Ing. Jiří Hošek, Ph.D. (člen)
prof. Ing. Miroslav Vozňák, Ph.D. (člen)
doc. Ing. Otto Dostál, CSc. (člen)
Date of acceptance
2024-12-11
Defence
Obhajoba práce probíhala prezenční formou v angličtině. Setkání zahájil předseda prof. Koton, kdy uvítal uchazečku, členy komise a přítomné hosty. Slovo bylo předáno ing. Mezině, která v rámci svého vystoupení prezentovala motivaci, dosažené výsledky a perspektivy další vědeckovýzkumné činnosti v oblasti tématu disertace. Následovala otevřená diskuze, především mezi Ing. Mezinou a prof. Vozňákem, do které se zapojili i ostatní členové komise (Hošek, Koton, Smékal) a hosté (Ometov). V detailu byly diskutovány hlavní přínosy disertační práce. Pozornost byla také věnována možnostem budoucího aplikačního využití v praxi. Ing. Mezina na dotazy reagovala pohotově a prokázala svoji erudici v oboru. Kromě členů komise se veřejné části zúčastnili také 3 hosté. Celková doba veřejného vystoupení trvala téměř 1,5 hodiny. Následovalo uzavřené jednání členů komise, která tajně hlasovala.
The dissertation defense took place on site. The event was initiated by the committee chair prof. Koton, who welcomed the applicant, the committee members, and guests. Ing. Mezina was asked to give her presentation, who within her speech discussed the motivation, reached results and perspectives for further research in the area of the dissertation topic. The presentation followed by open discussion, primarily between Ing. Mezina and prof. Vozňák, whereas also other committee members (Hošek, Koton, Smékal) and guests (Ometov) raised their questions. The main contribution of the dissertation was discussed in detail. The attention was also paid to future application of the results in practice. Ing. Mezina always responded promptly and proved her erudition in the area. Next to the committee members, 3 guests were also present during the public part. The public part of the defense took almost 1,5 hour. It was followed by non-public meeting of the committee members and secrete vote.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení