BOCH, J. Stereo rekonstrukce příčného profilu vozidla [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Cílem práce diplomanta Jana Bocha bylo navrhnout systém pro rekonstrukci příčného profilu vozidla za použití 3D rekonstrukce z více kamer. Toto téma je velmi složité a komplexní. Student pojal problém obecně, tedy jako obecnou 3D rekonstrukci, i když v zadání byla rekonstrukce pouze příčného profilu vozidla. Student si tedy naložil více práce, než bylo zapotřebí. Navíc byla zvolena metoda stereo 3D rekonstrukce ze 2 typově odlišných kamer, což není nemožné, ale rozhodně je to další zobecnění a další komplikace či výzva navíc. V samotné práci postrádám porovnání výstupů 3D stereo rekonstrukce s RGB-D kamerou. Student projevil dostatečné inženýrské schopnosti a i přes uvedené výtky doporučuji práci k obhajobě s hodnocením 70b. S odkazem na skutečnost, že konzultantem práce byl Ing. Tomáš Zemčík, detailní hodnocení nechávám na něm a cituji: T.Zemčík: Diplomová práce pana Bocha na téma "Stereo rekonstrukce příčného profilu vozidla" patří svým zadáním k poměrně komplexním. Vyžaduje nastudování matematického aparátu potřebného k 3D rekonstrukci, návrh a sestavení měřící aparatury a pořízení dat, a dále návrh a implementaci systému zpracování dat s vyhodnocením. V první kapitole student stručně popisuje metody snímání a rekonstrukce 3D objektů obecně bez bližšího zaměření na řešenou aplikace, obecně jsou zmíněné metody vhodné k řešení problému 3D rekonstrukce, ale chybí zde zejména průzkum používaných metod použitých pro řešení aplikací podobných zadané. Kapitola druhá obsahuje matematické pozadí výše popsaných metod a stručně a uceleně popisuje fungování stereo/multiview rekonstrukčního systému. Dále pak zmiňuje různé způsoby reprezentace 3D modelu v počítači. Kapitola 3 rozebírá různé možné konfigurace systému co do typů a počtů snímačů, zvláštní pozornost je zde věnována nakonec zvolené kombinaci 3D a plošných kamer, různé konfigurace jsou porovnávány pro obecnou scénu, a pro zkvalitnění této kapitoly by pomohl bližší rozbor zadané úlohy a úvaha nad výhodami a nevýhodami popisovaných systémů pro konkrétní konfiguraci scény v zadané úloze. Kapitola 4 obsahuje poměrně podrobný rozbor dostupných HW prostředků - 3D kamer na trhu s ohledem na jejich vlastnosti a vhodnost pro řešení dané úlohy. Dále specifikuje HW požadavky na plošnou kameru a objektiv pro konkrétní scénu a popisuje různé geometrické konfigurace měřícího systému dvou kamer (3D a 2D kamery), a volí konkrétní konfiguraci pro další sběr dat - chybí mi zde konkrétnější popis snímané scény a popis nasbíraného datasetu, dále zde není zmíněna synchronizace snímání a její vliv na další zpracování. V kapitole 5 se nachází samotný systém pro zpracování naměřených dat. Student popisuje navrhovaný systém pěknými a přehlednými blokovými diagramy a popisuje zvolené softwarové prostředky pro implementaci navrženého systému. Je zde popsáno nastavení snímání, kalibrace kamer, rektifikace snímků až po samotnou 3D rekonstrukci. Zde je popsáno několik metod a jsou prezentovány jejich výstupy. Některé jsou ovšem problematické, pro metodu stereoSGBM a její výstupy na obrázcích 5.10 a 5.11 evidentně nebylo dosaženo správně fungující rekonstrukce. Pro triangulační metodu a její výsledek prezentovaný v obrázku 5.14 zase nebylo nalezeno mnoho korespondujících bodů a výsledek je proto velmi řídké mračno bodů, obecně je automobil poměrně obtížnou scénou, ale nebylo možné zde dosáhnout lepšího výsledku? Dále kapitola obsahuje další metody pro 3D rekonstrukci. Kapitola 6 obsahuje zhodnocení systému kvalitativním popisem výstupů jednotlivých metod. Zde není zhodnocena triangulační metoda, a student se soustředil na porovnání výstupu 3D kamery s dalšími metodami. Celkově je práce psána čtivým jazykem který ale místy používá netechnických a matoucích výrazů. Obsahuje také drobné faktické chyby. Svým rozsahem ji považuji za dostatečnou, členění je povětšinou logické a typograficky je práce na dobré úrovni. Za slabiny práce považuji chybějící hlubší analýzu samotné úlohy, a roztříštění sil studenta na příliš mnoho metod namísto dotažení jedné. Student při práci pravidelně a svědomitě konzultoval, vždy přicházel s dobře připravenými dotazy a prezentoval výsledky své dosavadní práce. Na elektronickém nosiči je předložen funkční kód a všechna nasbíraná data. Přes výše zmíněné slabiny doporučuji práci k obhajobě.
Zpráva má 55 stránek a její prezentační a formální úroveň je spíše horší, především z důvodu horších vyjádření, které ztěžují text („kamery vyzařují paprsky“ str. 16; v obr. 2.8 měly být intrinsické matice paralelně, ne za sebou, a chybí jim koeficient 3,3; str. 43 bod 4 - není zřejmé, ke kterému vzorci se vztahují použité symboly; obr. 5.10 jako výsledek vůbec nerespektuje vlastnosti, které by měl splňovat;). Další problém je horší interpretace nastudovaného (str. 19 „velikost všech objektů je konstantní“; str. 28 rozdělení na barevné a šedo tónové obrázky; V kapitole 2.7 mi chybí obrázky prezentující danou problematiku). Pro řešení nastudoval literaturu, kterou uvedl a v práci citoval. Zadání je možné považovat za splněné, v práci mi výrazněji chybí rešerše a rozbor již používaných řešení, a podrobnější zhodnocení a popis dosažených výsledků. Metody jsou uvedeny v kap. 1, prostředky v kap. 4, kde by však bylo vhodné srovnání a hodnocení vůči realizovanému úkolu. Systém zpracování je uveden v kapitole 3, i zde bych přivítal finální tabulku s přehlednými daty a hodnocením použitelnosti. K lepším částem práce patří prezentace různých návrhů konfigurace kamer a jejich rozbor, který je kvalitní – je ovšem proveden pro obecnou scénu. Zde by bylo vhodnější stanovit požadavky úlohy, následně podmínky pro scénu a uvedenou teorii pomocí nich ihned zhodnotit. Obdobně kvalitně je popsán i HW s číselnými tabulkami parametrů. Také pořízený dataset svědčí o značném úsilí, které student vyvinul při zpracování práce a realizaci HW konfigurace (proč v práci není foto?). Z přiložených snímků (na vloženém médiu) je možné pozorovat různé způsoby a varianty pořízení dat, které svědčí o hledání nejvhodnějšího řešení. Student v kap.5 navrhl postup zpracování, postup popsal i pomocí blokových diagramů. Využití zvolených nástrojů je v pořádku. Vytvořil i řadu metod pro zpracování nasnímaných dat. I když je nutné konstatovat, že automobil je z hlediska standardních metod 3D rekonstrukce velice obtížný úkol, mohly být dosažené výsledky lepší. Popis výsledků a jejich získání je horší, kdy mi chybí např. nákres měřicí sestavy s úhly a vzdálenostmi. To značně ovlivňuje vypovídací hodnotu výsledků. Experiment i jeho realizaci bych označil za vhodné, ale využití různých aut v různých světelných podmínkách pro zhodnocení kvality nepovažuji za správné. Zvláště když na přiloženém nosiči jsou vhodné datové sady pořízené pro jeden vůz v různých směrech a sestavách. Stejně tak by bylo vhodné dosažené výsledky porovnat vůči stanoveným požadavkům. S tím souvisí i nedostatek rozborů úlohy, včetně podrobnějšího rozboru výsledků a chyb realizací se stanovením původu nepřesností. V tomto mi chybí hlubší vhled do řešené problematiky, kdy rozšíření o složitější 2D kameru je problematičtější, zatímco zvládnutí práce s komerční 3D kamerou svědčí o studentových schopnostech danou problematiku řešit. Přiložená práce svědčí o magisterských schopnostech studenta.
eVSKP id 160134