Počítání přepravek v obrazech
Loading...
Date
Authors
Mičulek, Petr
ORCID
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
V této práci se zabývám tématem počítání beden v obrazových datech pomocí technik hlubokého učení. V práci jsem navrhl řešení pro počítání beden, které představuji na fotkách krabiček sirek. Ačkoli původní řešení počítalo s využitím datové sady beden ze skladu pivovaru, sada nakonec nebyla dodána a na doporučení vedoucího práce byly pro řešení vybrány bloky krabiček sirek. Implementované řešení využívá plně konvoluční neuronovou síť založenou na klasifikaci, umožňující výstup ve vysokém rozlišení. Tato síť je trénována na výřezech fotek z datové sady, díky čemuž je řešení rychlé a síť je vhodná i pro použití na menších datových sadách. Síť detekuje ve fotkách klíčové body krabiček sirek, které jsou následně zpracovány algoritmem pro odhad klíčových bodů z predikce sítě a výpočet finálního počtu beden. Na validačním datasetu dosahuje řešení následujících výsledků: ve 12,5 % případů predikce selže a ve zbylých případech má průměrnou absolutní odchylku (MAE) 11,14. Pomocí rozsáhlých experimentů bylo řešení vyhodnoceno a výsledky potvrzují, že tento přístup může být použit pro počítání objektů.
This thesis deals with the topic of using deep learning to count crates in images. I have designed a crate-counting solution for blocks of matchboxes, using a fully convolutional classification-based network with a high resolution output. The original project proposition counted on using a dataset of photos of crates from a beer brewery warehouse. I did not get access to the dataset in the end. On the recommendation of my supervisor, I based the crate-counting solution on a custom dataset of matchbox photos. The CNN is trained using image patches, leading to a fast solution working even on smaller datasets. Matchbox keypoints are detected by the CNN in the input images and they are processed by a keypoint estimation and crate-counting algorithm to produce the final crate count. On validation data, the solution has a 12.5% failure rate and a MAE of 11.14. Thorough experimentation was performed to evaluate the solution and the results verify that this approach can be used for object counting.
This thesis deals with the topic of using deep learning to count crates in images. I have designed a crate-counting solution for blocks of matchboxes, using a fully convolutional classification-based network with a high resolution output. The original project proposition counted on using a dataset of photos of crates from a beer brewery warehouse. I did not get access to the dataset in the end. On the recommendation of my supervisor, I based the crate-counting solution on a custom dataset of matchbox photos. The CNN is trained using image patches, leading to a fast solution working even on smaller datasets. Matchbox keypoints are detected by the CNN in the input images and they are processed by a keypoint estimation and crate-counting algorithm to produce the final crate count. On validation data, the solution has a 12.5% failure rate and a MAE of 11.14. Thorough experimentation was performed to evaluate the solution and the results verify that this approach can be used for object counting.
Description
Citation
MIČULEK, P. Počítání přepravek v obrazech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda)
doc. Ing. Lukáš Burget, Ph.D. (místopředseda)
doc. Mgr. Lukáš Holík, Ph.D. (člen)
doc. Ing. Tomáš Martínek, Ph.D. (člen)
doc. Ing. Petr Matoušek, Ph.D., M.A. (člen)
Date of acceptance
2021-06-14
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jaké kroky při počítání objektů by bylo potřeba přidat / upravit, aby nedocházelo ke zbytečnému ignorování objektů s detekovanými sekundárními klíčovými body, pokud bude chybět některý z primárních (okrajových) bodů objektů? Dokázala by aplikace těžit z kontinuálního videa?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení