Možnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazů

but.committeeprof. Ing. Martin Augustynek, Ph.D. (předseda) Ing. Martin Mézl, Ph.D. (místopředseda) Ing. Vratislav Harabiš, Ph.D. (člen) Ing. Filip Plešinger, Ph.D. (člen) Ing. Tomáš Vičar, Ph.D. (člen) prof. Ing. Valentýna Provazník, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Vičar položil otázku: Proč používáte ResNet18? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.cs
but.jazykčeština (Czech)
but.programBioinženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorChmelík, Jiřícs
dc.contributor.authorValík, Tomášcs
dc.contributor.refereeNohel, Michalcs
dc.date.created2024cs
dc.description.abstractTato diplomová práce se zabývá možnostmi využití neuronových sítí založených na architektuře transformerů pro zpracování medicínských obrazů. Hlavním cílem bylo porovnat výkonnost modelů ResNet18 a Vision Transformer (ViT-B-16) na dvou odlišných datasetech, konkrétně Intel Image Classification a ChestXray. Modely byly optimalizovány pomocí frameworku Optuna a nakonec byl každý z nich trénován desetkrát pro zajištění robustnosti výsledků. ty ukazují, že modely využívající Vision Transformery dosahují vyšších hodnot váženého F1 skóre ve srovnání s modely ResNet18. Konkrétně dosáhl model ViT-B-16 nejvyššího F1 skóre 0,939 na datasetu Intel Image a 0,907 na datasetu ChestXray, zatímco ResNet18 dosáhl hodnot 0,883, respektivě 0,885. Statistické analýzy pomocí Wilcoxonova testu potvrdily, že rozdíly ve výkonnosti mezi modely jsou statisticky signifikantní, což naznačuje výhodu použití Vision Transformerů pro tyto úlohy. Uveden je také rozbor výpočetní náročnosti, která je pro ViT mnohem vyšší.cs
dc.description.abstractThis thesis explores the potential of neural networks based on transformer architecture for medical image processing. The main objective was to compare the performance of ResNet18 and Vision Transformer (ViT-B-16) models on two distinct datasets, specifically Intel Image Classification and ChestXray. The models were optimized using the Optuna framework and subsequently trained ten times each to ensure robustness of the results. These results indicate that models utilizing Vision Transformers achieve higher weighted F1 scores compared to ResNet18 models. Specifically, the ViT-B-16 model achieved the highest F1 score of 0.939 on the Intel Image dataset and 0.907 on the ChestXray dataset, whereas ResNet18 achieved scores of 0.883 and 0.885, respectively. Statistical analyses using the Wilcoxon test confirmed that the differences in performance between the models are statistically significant, suggesting an advantage of using Vision Transformers for these tasks. An analysis of computational complexity is also provided, highlighting that ViT requires significantly higher computational resources.en
dc.description.markAcs
dc.identifier.citationVALÍK, T. Možnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.cs
dc.identifier.other159777cs
dc.identifier.urihttp://hdl.handle.net/11012/247172
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectstrojové učenícs
dc.subjecttransformercs
dc.subjectneuronová síťcs
dc.subjectzpracování medicínských obrazůcs
dc.subjectself-attentioncs
dc.subjectvision transformercs
dc.subjectmachine learningen
dc.subjecttransformeren
dc.subjectneural networken
dc.subjectmedical image processingen
dc.subjectself-attentionen
dc.subjectvision transformeren
dc.titleMožnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazůcs
dc.title.alternativePotential of neural networks using transformers for medical image processingen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2024-06-11cs
dcterms.modified2024-06-11-15:19:39cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid159777en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:42:28en
sync.item.modts2025.01.17 11:31:00en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrstvícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.39 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
165.88 KB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
review_159777.html
Size:
6.5 KB
Format:
Hypertext Markup Language
Description:
file review_159777.html
Collections