Identifikace znaků na hloubkovém snímku pneumatiky

Loading...
Thumbnail Image
Date
Authors
Toth Vaňo, Pavol
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Táto práca sa zaoberá problémom detekcie, rozpoznania a segmentácie znakov na hĺbkovej snímke pneumatiky. V práci aplikovaný prístup horizontálne rozdelí vstupnú hĺbkovú snímku na prekrývajúce sa časti, v ktorých sú symboly detegované hlbokou neurónovou sieťou Mask R-CNN. Následným použitím algoritmu potlačenia nemaximálnych hodnôt sú zahodené duplicitné detekcie vznikajúce kvôli prekryvom. V práci je tiež predstavená modifikácia siete Mask R-CNN používajúca zdvojenú segmentačnú vetvu za účelom kvalitnejšej segmentácie symbolov s tenkými líniami a členitou maskou. Použitím navrhnutého prístupu dosiahla na pripravenej dátovej sade metrika mean average precision s IoU v intervale od 0,5 do 0,95 hodnotu 0,877 pre detekciu a 0,738 pre segmentáciu.
This thesis deals with the problem of detection, recognition and segmentation of characters on the depth scan of tire. The approach applied in the thesis horizontally splits the input depth scan into overlapping parts, in which the symbols are detected by the deep neural network Mask R-CNN. The duplicate detections emerging due to the overlap are discarded by the subsequent use of non-maximum suppression. The modification of Mask R-CNN, which utilises parallel segmentation branch with the aim of improving the quality of segmentation of symbols with thin lines or complex mask, is also proposed in the thesis. Applying the proposed approach on the prepared dataset, the values 0.877 and 0.738 were obtained as the mean average precision metrics for detection and segmentation in the IoU interval from 0.5 to 0.95.
Description
Citation
TOTH VAŇO, P. Identifikace znaků na hloubkovém snímku pneumatiky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda) Ing. Radek Kočí, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen)
Date of acceptance
2022-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Proč jste nepoužil generovaná data, která by proti stávající datové sadě měla jistě mnoho výhod? V použitých hloubkových datech by zřejmě bylo velice robustní generovat návrhy na výskyt jednotlivých symbolů nějakým konvenčním způsobem a navržené regiony pak klasifikovat neuronovou sítí. V čem by takový přístup byl ne/výhodnější než řešení celého problému naráz pomocí Faster R-CNN / Mask R-CNN? Experimenty ukazují, že použití augmentací při učení nic nepřináší. To je poněkud nezvyklé - jaké pro to máte vysvětlení? Jak to, že jsou výsledné obrázky krásně zarovnané? Chybí jakákoli rotace.
Result of defence
práce byla úspěšně obhájena
Document licence
Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/let
DOI
Collections
Citace PRO