Počítání vozidel v obraze a videu
Loading...
Date
Authors
Gabzdyl, Dominik
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Analýza silničního provozu je stále náročnou úlohou. V průběhu této úlohy se vyskytují mnohá úskalí, která je třeba brát na vědomí. Například malé rozlišení obrazu, vysoký počet překrývajících se objektů, úhel kamery, rozmazání objektů v důsledku jejich pohybu nebo povětrnostní podmínky. Tato práce adresuje tato úskalí použitím konvolučních neuronových sítí. V této práci představuji novou architektu založenou na principu počítání regresí (Counting by Regression). Navržená architektura je inspirována některými state-of-the-art architekturami a vylepšuje přesnost na různých datasetech. Například na velmi malém PUCPR+ datasetu byla odmocnina ze střední kvadratické chyby (RMSE) snížena z 34.46 na 6.99 vozidel (měřeno na test setu). Dosažené výsledky ukázaly, že je zde stále prostor ke zlepšení a možný další výzkum v oblasti počítání regresí.
Traffic analysis is still a challenging task. During such task there are many pitfalls to be aware of. Such as small image resolution, high number of overlapping objects, angle of camera, blurred objects due to their motion or weather conditions. This thesis addresses these issues by using the convolutional neural network approach. In this thesis I propose a new architecture which adheres to Counting by Regression principle. The proposed architecture is inspired by some state-of-the-art architectures and improves accuracy on various datasets. For instance on the very small PUCPR+ dataset the Root Mean Square Error between expected and predicted vehicle counts was reduced from 34.46 to 6.99 vehicles (measured on the test set). Results achieved showed that there is still space for improvements and a possible further research in Counting by Regression principle.
Traffic analysis is still a challenging task. During such task there are many pitfalls to be aware of. Such as small image resolution, high number of overlapping objects, angle of camera, blurred objects due to their motion or weather conditions. This thesis addresses these issues by using the convolutional neural network approach. In this thesis I propose a new architecture which adheres to Counting by Regression principle. The proposed architecture is inspired by some state-of-the-art architectures and improves accuracy on various datasets. For instance on the very small PUCPR+ dataset the Root Mean Square Error between expected and predicted vehicle counts was reduced from 34.46 to 6.99 vehicles (measured on the test set). Results achieved showed that there is still space for improvements and a possible further research in Counting by Regression principle.
Description
Citation
GABZDYL, D. Počítání vozidel v obraze a videu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda)
doc. Ing. Martin Čadík, Ph.D. (místopředseda)
doc. Ing. Michal Bidlo, Ph.D. (člen)
Ing. Matěj Grégr, Ph.D. (člen)
Ing. Radek Kočí, Ph.D. (člen)
Date of acceptance
2020-07-09
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Jaké alternativní návrhy architektury jste zvažoval či experimentoval? Jak se chovaly? Co činí navrženou síť "optimální"? Co jsou slabiny navržené a vytvořené sítě? V čem by potřebovala dále vylepšit? Jak?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení