Sledování objektů ve videu
Loading...
Date
Authors
Mičánková, Eva
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato diplomová práce se zabývá segmentací objektů v obrazových datech a sledováním objektů ve videosekvencích s využitím nejmodernějších modelů hlubokého učení. Hlavní část práce je věnována návrhu a realizaci řešení interaktivní segmentace střevních polypů, vycházejícího z modelu SAM2, který byl doladěn na proprietárních datových sadách poskytnutých společností MAIA Labs. Experimentálně byly dotrénované modely porovnány s tradičními segmentačními metodami, včetně architektur U-Net a systému tracking-by-detection. Výsledky experimentů prokázaly, že SAM2 dosahuje výrazně lepších výsledků, zejména v oblasti video segmentace, a vykazuje značný potenciál pro praktické využití, např. pro zrychlení a zpřesnění procesu anotace nových dat.
This thesis focuses on object segmentation in image data and object tracking in video sequences using state-of-the-art deep learning models. The core part of the work is dedicated to the design and implementation of an interactive segmentation solution for colorectal polyps, based on the SAM2 model fine-tuned on a proprietary datasets provided by MAIA Labs. The fine-tuned models were experimentally compared with traditional segmentation methods, including U-Net architectures and a tracking-by-detection system. The results demonstrated that SAM2 achieves significantly better performance, particularly in video segmentation, and that it shows strong potential for practical applications – for instance, in accelerating and improving the annotation of new data.
This thesis focuses on object segmentation in image data and object tracking in video sequences using state-of-the-art deep learning models. The core part of the work is dedicated to the design and implementation of an interactive segmentation solution for colorectal polyps, based on the SAM2 model fine-tuned on a proprietary datasets provided by MAIA Labs. The fine-tuned models were experimentally compared with traditional segmentation methods, including U-Net architectures and a tracking-by-detection system. The results demonstrated that SAM2 achieves significantly better performance, particularly in video segmentation, and that it shows strong potential for practical applications – for instance, in accelerating and improving the annotation of new data.
Description
Keywords
interaktivní segmentace , interaktivní tracking , XMem , Cutie , SAM , SAM2 , MedSAM-2 , U-Net , fine-tunování , kolonoskopie , kolorektální karcinom , střevní polypy , interactive segmentation , interactive tracking , XMem , Cutie , SAM , SAM2 , MedSAM-2 , U-Net , fine-tuning , colonoscopy , colorectal cancer , intestinal polyps
Citation
MIČÁNKOVÁ, E. Sledování objektů ve videu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Počítačové vidění
Comittee
doc. Ing. Martin Čadík, Ph.D. (předseda)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
prof. RNDr. Alexandr Meduna, CSc. (člen)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Zdeněk Materna, Ph.D. (člen)
Ing. David Bařina, Ph.D. (člen)
Date of acceptance
2025-06-24
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.
Result of defence
práce byla úspěšně obhájena
