Self-supervised učení v aplikacích počítačového vidění

Loading...
Thumbnail Image

Date

Authors

Vančo, Timotej

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Cieľom diplomovej práce je spraviť rešerš problematiky Self-supervised učenia v aplikáciách počítačového videnia, následne vybrať vhodnú testovaciu úlohu s rozsiahlym datasetom, aplikovať Self-supervised metódy a zhodnotiť. Teoretická časť práce je zameraná na popis metód v počítačovom videní, podrobný popis neurónových a konvolučných sietí a rozsiahle vysvetlenie a rozdelenie Self-supervised metód. Záver teoretickej časti je venovaný praktickým aplikáciám Self-supervised metód v praxi. Praktická časť diplomovej práce sa zaoberá popisom tvorby kódu na prácu s datasetmi a aplikáciou metód Rotácie, SimCLR, MoCo a BYOL v úlohe klasifikácie a sémantickej segmentácie. Každá aplikácia metódy je dopodrobna vysvetlená a vyhodnotená pri rôznych parametroch na veľkom datasete STL10. Následne je úspešnosť metód vyhodnotená pri rôznych datasetoch a sú pomenované obmedzujúce podmienky v úlohe klasifikácie. Praktická časť sa uzatvára pri aplikovaní SSL metód na predtrénovanie enkódera v aplikácii sémantickej segmentácie s datasetom Cityscapes.
The aim of the diploma thesis is to make research of the self-supervised learning in computer vision applications, then to choose a suitable test task with an extensive data set, apply self-supervised methods and evaluate. The theoretical part of the work is focused on the description of methods in computer vision, a detailed description of neural and convolution networks and an extensive explanation and division of self-supervised methods. Conclusion of the theoretical part is devoted to practical applications of the Self-supervised methods in practice. The practical part of the diploma thesis deals with the description of the creation of code for working with datasets and the application of the SSL methods Rotation, SimCLR, MoCo and BYOL in the role of classification and semantic segmentation. Each application of the method is explained in detail and evaluated for various parameters on the large STL10 dataset. Subsequently, the success of the methods is evaluated for different datasets and the limiting conditions in the classification task are named. The practical part concludes with the application of SSL methods for pre-training the encoder in the application of semantic segmentation with the Cityscapes dataset.

Description

Citation

VANČO, T. Self-supervised učení v aplikacích počítačového vidění [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

bez specializace

Comittee

prof. Ing. Pavel Václavek, Ph.D. (předseda) doc. Ing. Zdeněk Bradáč, Ph.D. (místopředseda) Ing. Zdeněk Havránek, Ph.D. (člen) Ing. Ilona Janáková, Ph.D. (člen) Ing. Petr Petyovský, Ph.D. (člen)

Date of acceptance

2021-06-09

Defence

Student obhájil diplomovou práci. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy odpověděl na dotazy: - Jakého typu byla klasifikace - binární, nebo do více tříd? - Stručně shrňte použité metody. - Jakým způsobem jste vybral základní model neuronové sítě?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO