Klasifikace obrazů s pomocí hlubokého učení

Loading...
Thumbnail Image

Date

Authors

Hřebíček, Zdeněk

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Práce se zabývá detekcí objektů v obraze a jejich klasifikací do tříd. Klasifikace je zajištěna modely prostředí pro hlubokého učení BVLC/Caffe; Detekci objektů zajišťují algoritmy AlpacaDB/selectivesearch a belltailjp/selective_search_py. Jedním z výsledků této práce je úprava a využití modelu hluboké konvoluční neuronové sítě AlexNet v prostředí BVLC/Caffe. Model byl natrénován s přesností 51,75% pro klasifikaci do 1 000 tříd, následně byl upraven a natrénován pro klasifikaci do 20 tříd s přesnotí 75.50%. Přínosem práce je implementace grafického rozhraní pro detekci a klasifikaci objektů do tříd, jež je implementováno jako aplikace na bázi webového serveru v jazyce Python. Aplikace integruje výše zmíněné algoritmy detekce objektů s klasifikací pomocí BVLC/Caffe. Výslednou aplikaci lze použít jak pro detekci (a klasifikaci) objektů, tak pro rychlé ověření klasifikačních modelů prostředí BVLC/Caffe. Tato aplikace byla pro možnost rozšíření a dlašího využití zveřejněna na serveru GitHub pod licencí Apache 2.0.
This thesis deals with image object detection and its classification into classes. Classification is provided by models of framework for deep learning BVLC/Caffe. Object detection is provided by AlpacaDB/selectivesearch and belltailjp/selective_search_py algorithms. One of results of this thesis is modification and usage of deep convolutional neural network AlexNet in BVLC/Caffe framework. This model was trained with precision 51,75% for classification into 1 000 classes. Then it was modified and trained for classification into 20 classes with precision 75.50%. Contribution of this thesis is implementation of graphical interface for object detction and their classification into classes, which is implemented as aplication based on web server in Python language. Aplication integrates object detection algorithms mentioned abowe with classification with help of BVLC/Caffe. Resulting aplication can be used for both object detection (and classification) and for fast verification of any classification model of BVLC/Caffe. This aplication was published on server GitHub under license Apache 2.0 so it can be further implemented and used.

Description

Citation

HŘEBÍČEK, Z. Klasifikace obrazů s pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Telekomunikační a informační technika

Comittee

doc. Ing. Miloš Orgoň, Ph.D. (předseda) prof. Ing. Jiří Mišurec, CSc. (místopředseda) Ing. Tomáš Zeman, Ph.D. (člen) doc. Ing. Pavel Šilhavý, Ph.D. (člen) Ing. Jan Mašek, Ph.D. (člen) Ing. Jiří Přinosil, Ph.D. (člen)

Date of acceptance

2016-06-09

Defence

Jaká jsou doporučení ohledně struktury DCNN s ohledem na velikost vstupních dat? Je ve fázích detekce obrazového objektu a jeho klasifikace uvažováno s různým natočením daného objektu?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO