Možnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazů
but.committee | prof. Ing. Martin Augustynek, Ph.D. (předseda) Ing. Martin Mézl, Ph.D. (místopředseda) Ing. Vratislav Harabiš, Ph.D. (člen) Ing. Filip Plešinger, Ph.D. (člen) Ing. Tomáš Vičar, Ph.D. (člen) prof. Ing. Valentýna Provazník, Ph.D. (člen) | cs |
but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Vičar položil otázku: Proč používáte ResNet18? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. | cs |
but.jazyk | čeština (Czech) | |
but.program | Bioinženýrství | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Chmelík, Jiří | cs |
dc.contributor.author | Valík, Tomáš | cs |
dc.contributor.referee | Nohel, Michal | cs |
dc.date.created | 2024 | cs |
dc.description.abstract | Tato diplomová práce se zabývá možnostmi využití neuronových sítí založených na architektuře transformerů pro zpracování medicínských obrazů. Hlavním cílem bylo porovnat výkonnost modelů ResNet18 a Vision Transformer (ViT-B-16) na dvou odlišných datasetech, konkrétně Intel Image Classification a ChestXray. Modely byly optimalizovány pomocí frameworku Optuna a nakonec byl každý z nich trénován desetkrát pro zajištění robustnosti výsledků. ty ukazují, že modely využívající Vision Transformery dosahují vyšších hodnot váženého F1 skóre ve srovnání s modely ResNet18. Konkrétně dosáhl model ViT-B-16 nejvyššího F1 skóre 0,939 na datasetu Intel Image a 0,907 na datasetu ChestXray, zatímco ResNet18 dosáhl hodnot 0,883, respektivě 0,885. Statistické analýzy pomocí Wilcoxonova testu potvrdily, že rozdíly ve výkonnosti mezi modely jsou statisticky signifikantní, což naznačuje výhodu použití Vision Transformerů pro tyto úlohy. Uveden je také rozbor výpočetní náročnosti, která je pro ViT mnohem vyšší. | cs |
dc.description.abstract | This thesis explores the potential of neural networks based on transformer architecture for medical image processing. The main objective was to compare the performance of ResNet18 and Vision Transformer (ViT-B-16) models on two distinct datasets, specifically Intel Image Classification and ChestXray. The models were optimized using the Optuna framework and subsequently trained ten times each to ensure robustness of the results. These results indicate that models utilizing Vision Transformers achieve higher weighted F1 scores compared to ResNet18 models. Specifically, the ViT-B-16 model achieved the highest F1 score of 0.939 on the Intel Image dataset and 0.907 on the ChestXray dataset, whereas ResNet18 achieved scores of 0.883 and 0.885, respectively. Statistical analyses using the Wilcoxon test confirmed that the differences in performance between the models are statistically significant, suggesting an advantage of using Vision Transformers for these tasks. An analysis of computational complexity is also provided, highlighting that ViT requires significantly higher computational resources. | en |
dc.description.mark | A | cs |
dc.identifier.citation | VALÍK, T. Možnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024. | cs |
dc.identifier.other | 159777 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247172 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | strojové učení | cs |
dc.subject | transformer | cs |
dc.subject | neuronová síť | cs |
dc.subject | zpracování medicínských obrazů | cs |
dc.subject | self-attention | cs |
dc.subject | vision transformer | cs |
dc.subject | machine learning | en |
dc.subject | transformer | en |
dc.subject | neural network | en |
dc.subject | medical image processing | en |
dc.subject | self-attention | en |
dc.subject | vision transformer | en |
dc.title | Možnosti neuronových sítí využívajících transformery pro zpracování medicínských obrazů | cs |
dc.title.alternative | Potential of neural networks using transformers for medical image processing | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2024-06-11 | cs |
dcterms.modified | 2024-06-11-15:19:39 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 159777 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 14:42:28 | en |
sync.item.modts | 2025.01.17 11:31:00 | en |
thesis.discipline | bez specializace | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav biomedicínského inženýrství | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 5.39 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 165.88 KB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_159777.html
- Size:
- 6.5 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_159777.html