Klasifikace kolejových vozidel
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Diplomová práce se věnuje klasifikaci kolejových vozidel na základě obrazové informace. V práci jsou teoreticky popsány a následně realizovány dva přístupy ke klasifikaci kolejových vozidel. Prvním přístupem je transformace snímků na histogramy vizuálních slov ze slovníku podle metody Bag of Visual Words a následná aplikace klasických klasifikátorů typu k-NN, SVM, Multinomial Naive Bayes, neuronová síť a Ensemble metoda typu voting classifiers. Druhým přístupem je klasifikace snímků pomocí ověřených architektur konvolučních neuronových sítí využitím metody transfer learning. Sítě AlexNet, VGG16 a ResNet50 byly předtrénovány na obsáhlém datasetu ImageNet a horní vrstvy byly dotrénovány na vlastním datasetu kolejových vozidel. Oba přístupy byly vyladěny pro nejlepší možné výsledky klasifikace. Pro jejich srovnání byl sestaven trénovací dataset s 1773 snímky ve 27 třídách a testovací dataset obsahující 444 snímků. Na testovacím datasetu dosáhl nejúspěšnější klasifikátor s transformací snímků BoVW metodou správnosti 89%. Konvoluční neuronové sítě dosáhly správnosti 95-97%, což je výrazně lepší výsledek. V práci jsou také zohledněny doby predikce nových snímků pro oba přístupy. Nad rámec práce byl implementován algoritmus pro dělení snímků vlakové soupravy na jednotlivé snímky vozů. V závěru jsou uvedeny limitace a popsány důvody omezené robustnosti algoritmu.
This Master's thesis deals with classification of railway wagons based on visual information. A theoretical background of two different approaches for a classification system is provided and both approaches are subsequently implemented. First approach includes transforming images of wagons to histograms of visual words, according to the Bag of Visual Words method. Afterwards, classifiers such as k-NN, SVM, Multinomial Naive Bayes, neural network and Ensemble method, specifically Voting classifiers, are applied. Second approach is classifying images using well known architectures of Convolutional Neural Networks and transfer learning. AlexNet, VGG16 and ResNet50 were pre-trained on a large ImageNet dataset and the upper layers were trained on the dataset of railway wagons. Both approaches were fine-tuned for the best possible performance. For comparison of both approaches a training dataset with 1773 images in 27 classes and testing dataset with 444 images were compiled. On testing dataset the best classifier using BoVW method reached accuracy of 89%. Convolutional neural nets performed with 95-97% accuracy, which is an improvement. Prediction times of images to be classified are also considered. Beyond the scope of the assignment of this thesis, an algorithm for splitting train images into images of individual wagons was developed. In the conclusion, limitations and reasons for limited robustness of this algorithm are presented.
This Master's thesis deals with classification of railway wagons based on visual information. A theoretical background of two different approaches for a classification system is provided and both approaches are subsequently implemented. First approach includes transforming images of wagons to histograms of visual words, according to the Bag of Visual Words method. Afterwards, classifiers such as k-NN, SVM, Multinomial Naive Bayes, neural network and Ensemble method, specifically Voting classifiers, are applied. Second approach is classifying images using well known architectures of Convolutional Neural Networks and transfer learning. AlexNet, VGG16 and ResNet50 were pre-trained on a large ImageNet dataset and the upper layers were trained on the dataset of railway wagons. Both approaches were fine-tuned for the best possible performance. For comparison of both approaches a training dataset with 1773 images in 27 classes and testing dataset with 444 images were compiled. On testing dataset the best classifier using BoVW method reached accuracy of 89%. Convolutional neural nets performed with 95-97% accuracy, which is an improvement. Prediction times of images to be classified are also considered. Beyond the scope of the assignment of this thesis, an algorithm for splitting train images into images of individual wagons was developed. In the conclusion, limitations and reasons for limited robustness of this algorithm are presented.
Description
Citation
KOTRLÝ, M. Klasifikace kolejových vozidel [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
bez specializace
Comittee
doc. Ing. Miloš Železný, Ph.D. (předseda)
doc. Ing. Petr Blaha, Ph.D. (místopředseda)
Ing. Jakub Arm, Ph.D. (člen)
Ing. Peter Honec, Ph.D. (člen)
Ing. Stanislav Klusáček, Ph.D. (člen)
Ing. Soběslav Valach (člen)
Date of acceptance
2023-06-06
Defence
Student začal prezentací své diplomové práce. Následně odpovídal na následující dotazy:
Otázka č.1: Jak vhodné jsou pro klasifikaci kolejových vozidel navrhované příznaky typu SIFT? Nedochází k detekcím pozadí, nebo stejných bodů (např. podvozky) napříč různými třídami vozidel? Nebylo by lepší použít příznaky, které nejsou založeny pouze na klíčových bodech?
Otázka č.2: Proč jste si vybral pro vyhodnocení pouze metriku Accuracy? Je možné použít např. Precission, Recall, nebo F1-score? Jaké jsou výsledky pro tyto zmiňované metriky?
Otázka č.3: Proč pro augmentaci vstupních dat nebyly použity knihovní funkce frameworku Keras, nebo přímo určené augmentační knihovny jako např. Albumentations? Podle mého názoru mohou zhoršený výkon CNN při použití augmentací způsobovat nevhodně zvolené augmentační techniky.
Otázka č.4: Co jste použil za systém zpracování dat a jak dlouho trvalo dotrénování?
Otázka č.5: Jak dlouho trvá klasifikace?
Otázka č.6? Dataset jste si vytvořil nebo převzal?
Otázka č.7: Zasahoval jste do akvizice obrazu?
Otázka č.8: Vytvořil jste vlastní neuronovou síť?
Otázka č.9: Jaký byl odhad chyb?
Student obhájil diplomovou. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy odpověděl na dotazy.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení