Re-identifikace vozidel pomocí vision transformerů
but.committee | prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Martin Čadík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Ing. Vítězslav Beran, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. David Bařina, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Špaňhel, Jakub | cs |
dc.contributor.author | Jelínek, Zdeněk | cs |
dc.contributor.referee | Hradiš, Michal | cs |
dc.date.accessioned | 2023-07-17T08:06:47Z | |
dc.date.available | 2023-07-17T08:06:47Z | |
dc.date.created | 2023 | cs |
dc.description.abstract | Hlavním cílem této práce bylo zjištění možností vision transformerů při re-identifikaci vozidel. V této oblasti počítačového vidění doposud dominují konvoluční neuronové sítě. Celkem byly vyzkoušeny dva modely - TransReID a CMT. TransReID je model založený čistě na vision transformerech a byl vytvořený přímo pro re-identifikaci vozidel. Hlavní část experimentů s tímto modelem jsem věnoval využití klíčových bodů na vozidle. Při správné extrakci oblastí okolo klíčových bodů a využití postprocessingu jsem dosáhl state-of-the-art výsledků. Model CMT je kombinací konvolučních sítí a transformerů, který nebyl vytvořen pro re-identifikaci vozidel. Model jsem upravil a provedl s ním rozsáhlé experimenty pro získání nejlepší konfigurace pro re-identifikaci vozidel. Modely jsem vyhodnotil na standardních datasetech VeRi-776, VehicleID, CityFlowV2-ReID a CarsReId74k a porovnal se state-of-the-art modely. S modelem CMT jsem dosáhl na datasetu VeRi-776 nejlepšího výsledku 0,860 na metrice mAP a na datasetu VehicleID jsem dosáhl nejlepšího výsledku 97,6% na metrice Rank5. | cs |
dc.description.abstract | The main objective of this thesis was to investigate the potential of vision transformers in vehicle re-identification. Convolutional neural networks have so far dominated this area of computer vision. In total, two models have been tested - TransReID and CMT. TransReID is a model based purely on vision transformers and was created specifically for vehicle re-identification. The main part of the experiments with this model was devoted to the use of key points on the vehicle. With proper extraction of the regions around the key points and the use of post-processing, I achieved state-of-the-art results. The CMT model is a combination of convolutional networks and transformers that was not designed for vehicle re-identification. I modified the model and conducted extensive experiments with it to obtain the best configuration for vehicle re-identification. I evaluated the models on the standard datasets VeRi-776, VehicleID, CityFlowV2-ReID and CarsReId74k and compared with state-of-the-art models. With the CMT model, I achieved the best result of 0.860 on the mAP metric on the VeRi-776 dataset and the best result of 97.6% on the Rank5 metric on the VehicleID dataset. | en |
dc.description.mark | B | cs |
dc.identifier.citation | JELÍNEK, Z. Re-identifikace vozidel pomocí vision transformerů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023. | cs |
dc.identifier.other | 144763 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/211915 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | vision transformer | cs |
dc.subject | re-identifikace vozidel | cs |
dc.subject | TransReID | cs |
dc.subject | CMT | cs |
dc.subject | VeRi-776 | cs |
dc.subject | CityFlowV2-ReID | cs |
dc.subject | VehicleID | cs |
dc.subject | CarsReId74k | cs |
dc.subject | vision transformer | en |
dc.subject | vehicle re-identification | en |
dc.subject | TransReID | en |
dc.subject | CMT | en |
dc.subject | VeRi-776 | en |
dc.subject | CityFlowV2-ReID | en |
dc.subject | VehicleID | en |
dc.subject | CarsReId74k | en |
dc.title | Re-identifikace vozidel pomocí vision transformerů | cs |
dc.title.alternative | Vehicle Re-Identification Using Vision Transformers | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2023-06-20 | cs |
dcterms.modified | 2023-06-20-11:12:24 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 144763 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2023.07.17 10:06:47 | en |
sync.item.modts | 2023.07.17 09:40:55 | en |
thesis.discipline | Počítačové vidění | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |