Self-supervised přístupy pro efektivní analýzu 3D tvarů

Loading...
Thumbnail Image

Date

Authors

Krsička, Tomáš

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Hluboké učení na 3D mesh datech je náročné kvůli jejich nepravidelné struktuře, která často vyžaduje zjednodušení reprezentace. Tato práce zkoumá využití graph neural networks jako alternativu pro přímé zpracování těchto dat. Při adaptaci těchto modelů pro self-supervised pretraining pomocí autoencoderů je identifikován zásadní nedostatek: stávající pooling a zejména unpooling metody nejsou dostatečné pro kvalitní rekonstrukci. Tato príce prezentuje novou statickou předpočítanou pooling a unpooling metodu, využívající pevné váhy odvozené z geometrie meshe. Nově sestavený výběr z datasetu MedShapeNet, označený jako MedShapeNet19, umožňuje komplexní vyhodnocení jak pro klasifikační, tak rekonstrukční úlohy. Experimenty ukázaly, že navržená metoda dosahuje vyšší obecné podobnosti rekonstrukcí, snižuje topologické artefakty a zlepšuje přesnost klasifikace, zejména v případech s omezeným množstvím trénovacích dat.
Deep learning on 3D polygon meshes is challenging due to their irregular structure, which often requires conceptual simplification. This thesis investigates using graph neural networks as an alternative to directly process mesh-based data. In adapting these models for self-supervised pretraining via autoencoders, the work identifies a critical limitation, as existing pooling and especially unpooling methods are insufficient for high-quality reconstruction. To address this, static precomputed pooling and unpooling is introduced, using fixed weights derived from mesh geometry. A newly curated dataset MedShapeNet19 is introduced which enables comprehensive evaluation across both classification and reconstruction tasks. The experiments showed that the proposed method achieves greater general reconstruction similarity, reduces topological artifacts, and improves downstream classification accuracy especially in situations where training data is limited.

Description

Citation

KRSIČKA, T. Self-supervised přístupy pro efektivní analýzu 3D tvarů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Počítačové vidění

Comittee

doc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)

Date of acceptance

2025-06-24

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO