Klasifikace 3D tvarů pomocí grafových neuronových sítí

Loading...
Thumbnail Image

Date

Authors

Klajbl, David

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato práce se zabývá využitím grafových neuronových sítí pro klasifikaci 3D tvarů, což je klíčový úkol v řadě oblastí, jako je kontrola kvality ve výrobě, porozumění 3D scénám v robotice a analýza lékařských obrazových dat. Hlavním přínosem této práce je nová grafová neuronová síť s názvem DGCNNwSub, která vychází z populární Dynamic Graph CNN (DGCNN) a je navržena pro klasifikaci 3D tvarů reprezentovaných mračny bodů. DGCNNwSub rozšiřuje původní architekturu o hierarchický mechanismus poolingu a prostorovou transformační síť pro zarovnání vstupů. Natrénovaný model byl otestován na datové sadě ModelNet40, kde dosáhl přesnosti 91,8% a průměrné přesnosti tříd 88,3%, což je srovnatelné s předními současnými přístupy. V práci jsou dále představeny experimenty zkoumající robustnost modelu vůči neuniformnímu rozmístění vstupních bodů a nezarovnané orientaci vstupních tvarů. Navíc byly pro zvýšení transparentnosti modelu použity metody, které vysvětlují jeho rozhodovací proces pomocí identifikace rysů vstupního tvaru, jež nejvíce ovlivnily predikci modelu.
This work explores the application of graph neural networks to 3D shape classification, a key task in areas such as manufacturing quality control, scene understanding in robotics, and medical image analysis. The core contribution of this work is DGCNNwSub, a novel graph neural network based on the popular Dynamic Graph CNN (DGCNN), designed to classify 3D shapes represented as point clouds. DGCNNwSub extends the original architecture with a hierarchical pooling mechanism and a spatial transformer network for input alignment. The model was evaluated on the ModelNet40 dataset, achieving 91.8% overall accuracy and 88.3% mean class accuracy—results competitive with state-of-the-art methods. This work also presents experiments examining the model's robustness to non-uniform point distribution and misaligned input shape orientations. Additionally, to improve the model's transparency, input attribution methods were used to explain its decision-making process by identifying the most influential features of the input shape for the model's prediction.

Description

Citation

KLAJBL, D. Klasifikace 3D tvarů pomocí grafových neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Informační technologie

Comittee

doc. RNDr. Pavel Smrž, Ph.D. (předseda) Ing. Michal Hradiš, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Tomáš Goldmann, Ph.D. (člen) Ing. Martin Žádník, Ph.D. (člen)

Date of acceptance

2025-06-17

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO