Použití hlubokého učení a unsupervised learning pro segmentaci obrazu
Loading...
Date
Authors
Gonzalez, Bruno
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Metody učení bez učitele v oblasti počítačového vidění představují slibný směr pro automatickou detekci objektů a instanční segmentaci, který nevyžaduje manuální anotaci dat. Tato práce zkoumá možnosti přenosu metody CutLER a jejích komponent na segmentaci anomálií pro zemědělské letecké snímky datové sady Agriculture-Vision. V první části práce je testována architektura Cascade Mask R-CNN, která však vykazovala nestabilní trénink a problémy s detekcí ohraničujících obdélníků zemědělských anomálií. Druhou část experimentů tvoří použití algoritmu MaskCut pro generování pseudo-masek a jejich využití jako doplňkových anotací při tréninku segmentačního modelu U-Net++. Výsledky ukazují, že generované masky mají nízkou přesnost a jejich použití v tréninku vede ke zhoršení výsledků. Nejlepších výsledků dosáhl model U-Net++ trénovaný pouze na původních anotacích v~multi-class režimu. Práce identifikuje hlavní příčiny neúspěchu metody CutLER v~doméně zemědělských dat a navrhuje možná vylepšení.
Unsupervised learning methods in computer vision represent a promising direction for automatic object detection and instance segmentation without the need for manual data annotation. This work explores the applicability of the CutLER method and its components for anomaly segmentation in agricultural aerial imagery from the Agriculture-Vision dataset. The first part of the work evaluates the Cascade Mask R-CNN architecture, which, however, showed unstable training and problems with detecting bounding boxes of agricultural anomalies. The second set of experiments involves using the MaskCut algorithm to generate pseudo-masks and utilizing them as additional annotations during the training of a U-Net++ segmentation model. The results show that the generated masks have low accuracy and their use in training leads to decreased performance. The best performance was achieved by the U-Net++ model trained solely on the original annotations in a multi-class setting. The work identifies the main reasons for the failure of the CutLER method in the agricultural data domain and suggests possible improvements.
Unsupervised learning methods in computer vision represent a promising direction for automatic object detection and instance segmentation without the need for manual data annotation. This work explores the applicability of the CutLER method and its components for anomaly segmentation in agricultural aerial imagery from the Agriculture-Vision dataset. The first part of the work evaluates the Cascade Mask R-CNN architecture, which, however, showed unstable training and problems with detecting bounding boxes of agricultural anomalies. The second set of experiments involves using the MaskCut algorithm to generate pseudo-masks and utilizing them as additional annotations during the training of a U-Net++ segmentation model. The results show that the generated masks have low accuracy and their use in training leads to decreased performance. The best performance was achieved by the U-Net++ model trained solely on the original annotations in a multi-class setting. The work identifies the main reasons for the failure of the CutLER method in the agricultural data domain and suggests possible improvements.
Description
Keywords
strojové učení , neuronové sítě , hluboké učení , učení bez učitele , instanční segmentace , zemědělské snímky , letecké snímkování , změna domény , CutLER , Detectron2 , fine-tuning , machine learning , neural networks , deep learning , unsupervised learning , instance segmentation , agricultural imagery , aerial imagery , domain shift , CutLER , Detectron2 , fine-tuning
Citation
GONZALEZ, B. Použití hlubokého učení a unsupervised learning pro segmentaci obrazu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. Ondřej Ryšavý, Ph.D. (předseda)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
doc. RNDr. Dana Hliněná, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
