Sémantická segmentace obrazu pomocí konvolučních neuronových sítí

Loading...
Thumbnail Image

Date

Authors

Špila, Filip

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta strojního inženýrství

ORCID

Abstract

Tato práce se zabývá rešerší a implementací vybraných architektur konvolučních neuronových sítí pro segmentaci obrazu. V první části jsou shrnuty základní pojmy z teorie neuronových sítí. Tato část také představuje silné stránky konvolučních sítí v oblasti rozpoznávání obrazových dat. Teoretická část je uzavřena rešerší zaměřenou na konkrétní architekturu používanou na segmentaci scén. Implementace této architektury a jejích variant v Caffe je převzata a upravena pro konkrétní použití v praktické části práce. Nedílnou součástí tohoto procesu jsou kroky potřebné ke správnému nastavení softwarového a hardwarového prostředí. Příslušná kapitola proto poskytuje přesný návod, který ocení zejména noví uživatelé Linuxu. Pro trénování všech variant vybrané sítě je vytvořen vlastní dataset obsahující 2600 obrázků. Je také provedeno několik nastavení původní implementace, zvláště pro účely použití předtrénovaných parametrů. Trénování zahrnuje výběr hyperparametrů, jakými jsou například typ optimalizačního algoritmu a rychlost učení. Na závěr je provedeno vyhodnocení výkonu a výpočtové náročnosti všech natrénovaných sítí na testovacím datasetu.
This thesis deals with the research and implementation of selected architectures of Convolutional Neural Networks (CNNs) for image segmentation. The fundamental terms from the theory of neural networks are summarized in the first part. It also presents the power of CNNs in the field of image data classification. The theoretical part concludes with the research focused on the particular network architecture and its variants used for scene segmentation. In the practical part, the Caffe implementation of the network is taken from its authors and tailored to the specific needs of this study. The steps required to properly set up the software and hardware environments are an essential part of the process. Therefore, the corresponding chapter gives a step-by-step guide that is especially helpful to new Linux users. A custom dataset containing 2600 segmented images is created and used for training all variants of the selected network. Several adjustments of the original implementation are performed, especially for applying the method of using pre-trained parameters of the networks. The training phase includes a selection of hyperparameters, such as the type of optimization algorithm. Finally, the performance and computational cost of the variants of the trained network are evaluated on a testing dataset.

Description

Citation

ŠPILA, F. Sémantická segmentace obrazu pomocí konvolučních neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2020.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Mechatronika

Comittee

RNDr. Vladimír Opluštil (předseda) doc. Ing. Robert Grepl, Ph.D. (místopředseda) prof. RNDr. Ing. Tomáš Březina, CSc. (člen) Ing. Dalibor Červinka, Ph.D. (člen) doc. Ing. Jiří Krejsa, Ph.D. (člen) doc. Ing. Peter Kriššák, Ph.D. (člen) doc. Ing. Radoslav Cipín, Ph.D. (člen) Ing. Josef Ferda (člen) mjr. Ing. Václav Křivánek, Ph.D. (člen)

Date of acceptance

2020-07-21

Defence

Student v prezentaci představil svou práci. Po přečtení posudku vedoucího práce a posudku oponenta práce student odpověděl na otázku položenou oponentem. Tuto otázku zodpověděl bez zaváhání. Dále odpovídal na otázky položené jednotlivými členy komise, směřující např. na původ použitých obrazových dat a možnost využití daného přístupu pro navigaci mobilního robota. Celé vystoupení včetně odpovědí na položené otázky hodnotila komise jako výborné.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO