MARTIŠEK, J. Registrace a rozpoznání objektu v rozšířené realitě [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Diplomant Jiří Martišek pracoval na své kvalifikační práci nadstandardním způsobem. První dva body zadání začal zpracovávat během prázdnin před převzetím zadání. Časově náročný byl výběr vhodné HW platformy pro rozšířenou realitu, protože jak nové typy tak nové verze známých typů se objevují průběžně s vylepšenými parametry. Student se velmi dobře orientoval jak v implementaci knihoven pro společné řízení HW (brýle Quest 3 a kamery StereoLabs) a pořízení dat, tak i v algoritmech detekce zvoleného objektu - ortogonálního hlavolamu. Náročnost úlohy je dána především podmínkou detekce libovolně zvoleného objektu v reálném čase a sledovaného nestaticky umístěným snímačem na hlavě (brýlích) operátora za současné manipulace s objektem. Takto komplexně definovaná úloha není dosud obecně uspokojivě vyřešena. Proto diplomantovo řešení i jen zvolené specifické úlohy považuji za velmi nadprůměrné. Student konzultoval své průběžné výsledky pravidelně v kroku cca 14 dní, výjimečně déle, vždy však obratem zpracoval všechny komentáře.
Diplomová práce pana Martiška se zabývá detekcí a rozpoznáváním objektů v rozšířené realitě (AR) pro průmyslové využití. Konkrétně je zaměřena na implementaci algoritmu, který umožňuje detekovat polohu a orientaci známých objektů v reálném čase, a to i za dynamických podmínek, jako je pohyb AR zařízení (např. brýlí) nebo částečné zakrytí objektů (okluze). Zadání lze zařadit mezi středně až více náročnější a rozhodně mezi perspektivní témata. Neztotožňuji se však s názorem, že využití AR spolu s lidským operátorem je levnější varianta k robotickým rukám. Byť tato cesta má mnoho výhod (zejm. flexibilitu), cena lidského operátora je v průmyslu právě ta nejvyšší položka. Toto je ale otázka spíše obchodní či filozofická nemající vliv na samotné řešení. Diplomant provedl krátkou rešerši v relevantní oblasti metod (YOLO, SIFT, SURF, ORB…) a celkem rozsáhlou v oblasti samotných zařízení pro AR a následně demonstroval funkčnost na úloze skládání dřevěného hlavolamu, která simuluje průmyslovou montáž. Pro detekci objektů byla zvolena scéna s jednotlivými dílky odlišenými barvou. Byť se nabízela celá škála pokročilých metod detekce objektu ve scéně, nakonec byla zvolena kvůli nespolehlivosti (zdůvodněno relativně stroze) celkem triviální metoda prahování v HSV prostoru. Zde si myslím, že je škoda takového zjednodušení a není využit potenciál detekce objektů ve scéně při znalosti jejich tvaru. Implementaci takto jednoduché metody ve zdrojovém kódu (konkrétně „visualization.py“) považuji za dost nevhodné, kdy např. jednotlivé barvy jsou definovány „natvrdo“ hodnotami přímo v kódu. V elektronické příloze postrádám jakýkoliv snímek či dataset, není tedy vůbec možné metody vyzkoušet bez vlastnictví zvoleného snímacího zařízení a stejně barevné kostky. Dle popisu bylo zadání splněno ve všech bodech, doporučuji toto demonstrovat například videem promítnutým při prezentaci takto zajímavé úlohy.
eVSKP id 167592