Inovace sítí typu enkodér-dekodér pro segmentaci lékařských obrazů
Loading...
Date
Authors
Kolařík, Martin
ORCID
Advisor
Referee
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Segmentace lékařských obrazů, proces značení každého pixelu v obraze za účelem rozlišení různých struktur, je klíčovým krokem pro automatizovanou přesnou identifikaci a analýzu anatomických rysů a patologických oblastí v dvojrozměrných a trojrozměrných lékařských obrazech. Navzdory pokrokům, které v posledních letech přinesla umělá inteligence a strojové učení, výzvy jako variabilita dat, výpočetní omezení, nevyváženost tříd a omezená dostupnost anotovaných datových sad nadále omezují přesnost a spolehlivost modelů segmentace v lékařských aplikacích. Tato disertační práce se těmto výzvám věnuje vývojem nových přístupů, které zahrnují vylepšení architektur segmentačních neuronových sítí a inovativní tréninkové metody. Navrhovaná vylepšení neuronových sítí typu enkodér-dekodér prokázaly významné zlepšení výkonu segmentace jak u 2D, tak u 3D lékařských obrazů. Výzkum se rovněž zabývá pokročilými tréninkovými metodami, jako je přenesené učení a techniky normalizace, a ukazuje, jak tyto strategie mohou zlepšit výkon modelů, zejména v prostředích s omezenými daty a zdroji. Vytvořením nových architektur neuronových sítí typu enkodér-dekodér a aplikací pokročilých tréninkových metod představený výzkum demonstruje významná zlepšení přesnosti a efektivity segmentace. Zjištění ukazují, že tyto inovace nejenže řeší specifické výzvy spojené s daty lékařských obrazů, ale také překonávají propast mezi modely segmentace určenými pro obecné účely a těmi zaměřenými na specifické potřeby lékařských obrazů. Tím, že tato disertační práce přináší inovace do návrhů a procesu tréninku segmentačních modelů, tak přispívá k přesnějším diagnostickým nástrojům a nepřímo lepší péči o pacienty. Tyto pokroky mohou být navíc aplikovány v různých modalitách lékařských obrazů, čímž se rozšiřuje záběr výzkumu a jeho relevance pro různé oblasti zdravotní péče.
Medical image segmentation, the process of assigning labels to each pixel in an image to distinguish different structures, is a crucial step for automating the accurate identification of anatomical and pathological regions in both 2D and 3D images. Despite the advancements brought by artificial intelligence and machine learning in recent years, challenges such as data variability, computational constraints, class imbalance, and limited availability of annotated datasets continue to impede the accuracy and reliability of segmentation models in medical settings. This dissertation addresses these challenges by developing novel approaches that include architectural enhancements and innovative training methods. The proposed refinements to encoder-decoder neural networks are shown to significantly improve segmentation performance in both 2D and 3D medical imaging. Additionally, the research explores advanced training strategies, such as transfer learning and normalization techniques, to demonstrate how these methods can enhance model performance, especially in data-limited and resource-constrained environments. By creating new encoder-decoder architectures and applying these advanced training strategies, the presented research demonstrates significant improvements in segmentation accuracy and efficiency. The findings reveal that these innovations not only tackle the specific challenges of medical imaging data but also bridge the gap between general-purpose segmentation models and the specialized needs of medical imaging. By advancing the design and training of segmentation models, this dissertation contributes to more accurate diagnostic tools and improved patient care. Importantly, these advancements have the potential to be applied across various medical imaging modalities, thereby broadening the scope of the research and its relevance to different areas of healthcare.
Medical image segmentation, the process of assigning labels to each pixel in an image to distinguish different structures, is a crucial step for automating the accurate identification of anatomical and pathological regions in both 2D and 3D images. Despite the advancements brought by artificial intelligence and machine learning in recent years, challenges such as data variability, computational constraints, class imbalance, and limited availability of annotated datasets continue to impede the accuracy and reliability of segmentation models in medical settings. This dissertation addresses these challenges by developing novel approaches that include architectural enhancements and innovative training methods. The proposed refinements to encoder-decoder neural networks are shown to significantly improve segmentation performance in both 2D and 3D medical imaging. Additionally, the research explores advanced training strategies, such as transfer learning and normalization techniques, to demonstrate how these methods can enhance model performance, especially in data-limited and resource-constrained environments. By creating new encoder-decoder architectures and applying these advanced training strategies, the presented research demonstrates significant improvements in segmentation accuracy and efficiency. The findings reveal that these innovations not only tackle the specific challenges of medical imaging data but also bridge the gap between general-purpose segmentation models and the specialized needs of medical imaging. By advancing the design and training of segmentation models, this dissertation contributes to more accurate diagnostic tools and improved patient care. Importantly, these advancements have the potential to be applied across various medical imaging modalities, thereby broadening the scope of the research and its relevance to different areas of healthcare.
Description
Keywords
Segmentace obrazu, umělá inteligence, strojové učení, přenesené učení, architektura enkodér-dekodér, konvoluční neuronové sítě, zpracování lékařských obrazů, image segmentation, artificial intelligence, machine learning, transfer learning, encoder-decoder architecture, convolutional neural networks, medical image processing
Citation
KOLAŘÍK, M. Inovace sítí typu enkodér-dekodér pro segmentaci lékařských obrazů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
bez specializace
Comittee
prof. Ing. Jaroslav Koton, Ph.D. (předseda)
prof. Ing. Zdeněk Smékal, CSc. (člen)
doc. Ing. Kamil Říha, Ph.D. (člen)
doc. Ing. Jiří Hošek, Ph.D. (člen)
Dr. Aleksandr Ometov - reviewer (člen)
doc. Ing. Otto Dostál, CSc. - reviewer (člen)
Date of acceptance
2024-12-11
Defence
Obhajoba práce probíhala prezenční formou. Setkání zahájil předseda prof. Koton, kdy uvítal uchazeče, členy komise a přítomné hosty. Slovo bylo předáno ing. Kolaříkovi, který v rámci svého vystoupení prezentoval motivaci, dosažené výsledky a perspektivy další vědeckovýzkumné činnosti v oblasti tématu disertace. Následovala otevřená diskuze, především mezi Ing. Kolaříkem a D.Sc. Ometovem, do které se zapojili i ostatní členové komise. Během diskuze byla pozornost také věnována možnostem navazujícího výzkumu a budoucího aplikačního využití v praxi. Ing. Kolařík na dotazy reagoval pohotově a prokázal tak svoji erudici v oboru. Kromě členů komise se veřejné části zúčastnilo také 5 hostů. Celková doba veřejného vystoupení trvala téměř 1,5 hodiny. Následovalo uzavřené jednání členů komise, která tajně hlasovala.
The dissertation defense took place on site. The meeting was initiated by the committee chair prof. Koton, who welcomed the applicant, the committee members, and guests. Ing. Kolařík was asked to give his presentation, who within his speech discussed the motivation, reached results and perspectives for further research in the area of the dissertation topic. The presentation followed by open discussion, primarily between Ing. Kolařík and D.Sc. Ometov, whereas also other committee members raised their questions. During the discussion the attention was also paid to future research challenges and application of the results in practice. Ing. Kolařík always responded promptly and proved his erudition in the area. Next to the committee members, 5 guests were also present during the public part. The public part of the defense took almost 1,5 hours. It was followed by non-public meeting of the committee members and secrete vote.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení