PUKANEC, D. Hluboké neuronové sítě pro sesouhlasení 3D modelů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Mr Pukanec did an excellent job with the challenging topic. He understood the problem and the existing methods well and designed and implemented several meaningful experiments to compare the FINet and Lepard models published in 2022. He also prepared suitable datasets for the experiments. Although he did not fundamentally change the architecture of the models (which are really complex), his experiments supplement the articles of the original authors and further evaluate the properties of both methods.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | The diploma thesis is dedicated to solving the classic problem of alignment (also registration) of 3D models and point clouds using state-of-the-art methods based on deep learning. These very advanced and complex methods are not easy to work with and experiment with. Design of experiments requires a very good understanding of the problem and preparation of data sets. For these reasons, the topic is more challenging. | ||
Práce s literaturou | The student worked very intensively with the literature and studied a number of scientific publications on the topic. | ||
Aktivita během řešení, konzultace, komunikace | The student was proactive and consulted regularly. He was always prepared and devised a clear plan for the next steps. The consultations were beneficial for both parties. | ||
Aktivita při dokončování | The work was completed well in advance, and the technical report was sufficiently consulted. | ||
Publikační činnost, ocenění | The work was presented at the Excel@FIT conference, where it received an award from an academic committee. |
Autor řešil úlohu registrace 3D mračen bodů. Ve své práci porovnal dvě aktuální metody hlubokého učení založené na různých principech. Vhodně využil augmentaci dat pro prozkoumání klíčových vlastností metod v dané úloze. Rozsáhlé experimenty provedl na dvou datových sadách, kdy jedna je standardem v dané úloze a druhá zkoumá chování metod v nové aplikační doméně (3D modely chrupu). Na výsledné práci lze ocenit kvalitu studia a autorovo hluboké pochopení dané problematiky, vysoce odbornou kvalitu textu, vědecký přístup při realizaci experimentů a především nové poznatky v dané problematice.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | |||
Rozsah splnění požadavků zadání | |||
Rozsah technické zprávy | |||
Prezentační úroveň technické zprávy | 95 | Zpráva má excelentní prezentační úroveň, je vyvážená a logicky strukturovaná. Autor pečlivě, srozumitelně, věcně a velmi odborně nejdříve představí problém a jeho tradiční řešení, včetně metrik a používaných datasetů. Pokračuje popisem nových přístupů založených na hlubokém učení, kdy odborně prezentuje klíčové atributy existujících přístupů a na tomto základě pak vybírá dvě metody, které bude používat a které detailně vysvětluje. Před precizním popisem a diskuzí výsledků experimentů, pečlivě popíše problémy, které chce v experimentech řešit, způsob jejich provedení a způsob provádění augmentace dat a význam různých podmínek a parametrů. Ačkoliv se jedná o odborně náročnou problematiku, autor veškeré informace popisuje jasně a srozumitelně a čtenář si z četby odnáší mnoho důležitých poznatků. Vytknout lze jen drobné prohřešky, např. překlep v názvu metody Chamfer Distance, možná jinou normalizaci v rovnici 2.4, kdy by bylo vhodnější použít průměr, namísto součtu průměrů nebo výjimečně zapomenutá pracovní poznámka v textu (např. str. 28). V české verzi abstraktu chybí jedna věta z anglické verze. | |
Formální úprava technické zprávy | 90 | Text je srozumitelný a jasný. Zpráva je psána anglickým jazykem, odborně a kvalitně, a nevykazuje gramatické chyby. Technická zpráva vhodně využívá formátování textu. Na grafy by bylo lepší použít vektorový formát, ale díky rastrovému formátu s vysokým rozlišením to nepůsobí rušivě. | |
Práce s literaturou | 90 | Autor čerpá z rozsáhlého seznamu vědeckých relevantních publikací. Existující práce pečlivě studuje a netriviální postupy a CNN architektury prezentuje srozumitelně a velmi odborně. Z textu i způsobu realizace je vidět, že problematice dobře rozumí. Omylem je v seznamu jeden zdroj dvakrát ([24] a [25]). | |
Realizační výstup | 90 | Výsledkem práce je rozsáhlá sada velmi relevantních experimentů porovnávající vlastnosti dvou vybraných aktuálních CNN architektur pro registraci 3D mračen bodů, a to konkrétně FINet a Lepard. Vybrané metody dobře reprezentují dva rozdílné přístupy k řešení dané úlohy, kdy jedna pracuje s korespondencí 3D bodů a druhá nikoliv. Kromě běžně používané datové sady v této úloze, ModelNet40, provedl experimenty i s datovou sadou Teeth3DS, díky čemuž prokázal použitelnost vybraných metod i na jiných datech. Klíčovou částí řešení je augmentace dat, která 3D modely převádí na mračna bodů a zavádí potřebná zkreslení dat dle podmínek: různá hustota vzorkování, různé pokrytí při vzorkování, různá míra ořezu a překrytí, různé transformace a různá míra šumu. Díky vhodné volbě těchto podmínek provádí i experiment přiblužující se situaci v reálných podmínkách, kdy tento experiment je realizován na datasetu Teeth3DS. Autor provádí experimenty podle standardního protokolu používaného vědeckou komunitou v dané úloze, ačkoliv ve své práci své výsledky explicitně s publikovanými výsledky neporovnává. Zaměřuje se na chování a porovnání metod FINet a Lepard v různých podmínkách. Zkoumané podmínky dobře odráží praktické požadavky: míra korespondence, míra překrytí, vliv šumu a schopnost zobecnění. V rámci experimentů autor prováděl i dotrénování modelů. Výsledné skripty a zdrojové soubory jsou logicky členěny a obsahují jak převzaté knihovny a modely, tak kód pro řízení experimentů, augmentaci, vzorkování a vizualizaci výsledků experimentů. Skripty jsou psány pečlivě, obsahují řadu kontrol, vše je správně logováno atd. | |
Využitelnost výsledků | Výsledky práce jsou výzkumného charakteru, přináší nové poznatky v dané oblasti a mají potenciál k publikování na vhodném světovém vědeckém fóru. |
eVSKP id 154315