Re-identifikace vozidel pomocí vision transformerů

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Hlavním cílem této práce bylo zjištění možností vision transformerů při re-identifikaci vozidel. V této oblasti počítačového vidění doposud dominují konvoluční neuronové sítě. Celkem byly vyzkoušeny dva modely - TransReID a CMT. TransReID je model založený čistě na vision transformerech a byl vytvořený přímo pro re-identifikaci vozidel. Hlavní část experimentů s tímto modelem jsem věnoval využití klíčových bodů na vozidle. Při správné extrakci oblastí okolo klíčových bodů a využití postprocessingu jsem dosáhl state-of-the-art výsledků. Model CMT je kombinací konvolučních sítí a transformerů, který nebyl vytvořen pro re-identifikaci vozidel. Model jsem upravil a provedl s ním rozsáhlé experimenty pro získání nejlepší konfigurace pro re-identifikaci vozidel. Modely jsem vyhodnotil na standardních datasetech VeRi-776, VehicleID, CityFlowV2-ReID a CarsReId74k a porovnal se state-of-the-art modely. S modelem CMT jsem dosáhl na datasetu VeRi-776 nejlepšího výsledku 0,860 na metrice mAP a na datasetu VehicleID jsem dosáhl nejlepšího výsledku 97,6% na metrice Rank5.
The main objective of this thesis was to investigate the potential of vision transformers in vehicle re-identification. Convolutional neural networks have so far dominated this area of computer vision. In total, two models have been tested - TransReID and CMT. TransReID is a model based purely on vision transformers and was created specifically for vehicle re-identification. The main part of the experiments with this model was devoted to the use of key points on the vehicle. With proper extraction of the regions around the key points and the use of post-processing, I achieved state-of-the-art results. The CMT model is a combination of convolutional networks and transformers that was not designed for vehicle re-identification. I modified the model and conducted extensive experiments with it to obtain the best configuration for vehicle re-identification. I evaluated the models on the standard datasets VeRi-776, VehicleID, CityFlowV2-ReID and CarsReId74k and compared with state-of-the-art models. With the CMT model, I achieved the best result of 0.860 on the mAP metric on the VeRi-776 dataset and the best result of 97.6% on the Rank5 metric on the VehicleID dataset.
Description
Citation
JELÍNEK, Z. Re-identifikace vozidel pomocí vision transformerů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Počítačové vidění
Comittee
prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Martin Čadík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Ing. Vítězslav Beran, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. David Bařina, Ph.D. (člen)
Date of acceptance
2023-06-20
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO