MIKŠÍK, O. Dynamické rozpoznávání scény pro navigaci mobilního robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.
Diplomová práce navazovala na předchozí projekty studenta, její podstatná část byla vypracována v rámci studentova pobytu na Robotics Institute v Carnegie Mellon University, kde byl jeho supervizorem prof. Martial Herbert. Student pracoval velmi iniciativně a samostatně, výborně pracoval s tuzemskou i cizojazyčnou literaturou. Práce byla konzultována před odjezdem studenta na zahraniční stáž, dále pracoval pod vedením zmíněného zahraničního profesora. Je třeba upozornit na studentovy velmi nadstandardní aktivity v oblasti konferenčních publikací, kdy student mimo jiné opakovaně publikoval na konferenci ICRA, což je jedna z nejprestižnějších konferencí v oboru. V současnosti vzniká časopisecký článek obsahující jádro studentovy práce. Předložená práce jednoznačně prokazuje studentovy vynikající inženýrské schopnosti a doporučuji ji k obhajobě s vynikajícím ohodnocením.
Pan Ondřej Mikšík zpracoval diplomovou práci na téma Dynamické rozpoznávání scény pro navigaci mobilního robotu. Zadání práce lze považovat za odborně a především časově náročné, i když je specifikováno poměrně obecně a je zaměřeno na vizuální navigaci robotu v otevřených podmínkách. Formálně je dokument zpracován velmi pečlivě, obsahuje všechny náležitosti vysokoškolské kvalifikační práce a obsahuje jen málo interpunkčních a pravopisných chyb. Typograficky má dokument výbornou úroveň a je čtivý. Samotný text je rozveden na 91 stranách od úvodu po závěr a je členěn do celkem šesti hlavních kapitol. V první úvodní kapitole je přesněji formulováno zadání řešeného problému a uvedeny některé aplikace související s navigací robotů. Po druhé přehledové kapitole současného stavu vývoje o vizuálních navigačních systémech a porozumění scéně se autor ve dvou klíčových kapitolách diplomové práce věnuje postupně navigaci bez-posádkových nebo lépe autonomních pozemních vozidel na základě obrazových dat z kamery a problematice porozumění scény. V kapitole 3 diplomant nejprve řeší otázku nalezení úběžníku a to odhadem převládajícího texturního toku na snímaném povrchu (str. 23). Texturní tok resp. lokální odezvy na něj jsou stanoveny pomocí banky Gaborových vlnek, i když tyto jsou z důvodu efektivního výpočtu úběžníku následně aproximovány binárními bloky. Z hlediska přehlednosti není na závadu předchozí popis filtrace Gaborovými vlnkami. Odhad polohy úběžníku je v druhé půli kapitoly použit pro stanovení oblasti učení modelu pro segmentaci cesty na základě barevné informace. Obě popisované metody tj. texturní lokalizace úběžníku a segmentace barvy směsí gausiánů se pro úlohy nejen autonomní navigace občas používají, nicméně přidaná hodnota této části práce spočívá v navržené kombinaci obou metod. Jediná výtka ke kapitole 3 směřuje k absenci stati o stabilitě nalezení úběžníku, ze kterého pak sekvenčně vychází následující segmentace barvy a je tedy na ní závislá. V následující kapitole 4 se diplomant věnuje problematice porozumění scény z hlediska konzistence značení tříd oblastí ve snímané scéně např. silnice, stromy, budovy, chodník apod. I když termín "prostorově časová konzistence" použitý pro název kapitoly nijak nekoliduje s jejím obsahem, bylo by zřejmě vhodnější kapitolu uvést jako porozumění obsahu scény i např. s přihlédnutím k hned prvnímu obrázku v kapitole na str. 45, který je typickým výstupem mechanismu porozumění obsahu. Pro značení oblastí v rámci jednoho snímku zvolil diplomant hierarchický přístup popsaný v literatuře a dále se věnuje časové konzistenci barvení oblastí, která jak z textu vyplývá, je kritická. K tomuto účelu diplomant využívá modifikovanou metodu optického toku LDOF (pro větší disparity), zabývá se možností šíření predikce značení oblasti mezi snímky, tedy v časové ose a také metrikami podobností obrazových segmentů. V této části práce diplomant projevil zjevně největší podíl vlastní invence a propojil mechanismy dříve užívané jen pro izolované problémy (např. pro stabilní trasování známého vzoru nebo vyhledávání obrazu). V předposlední kapitole autor uvádí experimentální výsledky a to jak na vlastní obrazové galerii (str. 75) tak i na vhodně účelově vybraných snímcích (str. 69). V práci však nejsou bohužel téměř vůbec zmiňovány žádné implementační kroky, takže je zřejmě chápána jako teoretický a metodický základ pro další práci. Na přiloženém DVD nejsou přítomny žádné kódy ani spustitelné aplikace, což by mělo být z formálního hlediska ještě konzultováno s vedoucím práce, přesto jsou výsledky alespoň částečně doloženy ve formě obrázků v dokumentu práce a ve formě videí na datovém nosiči. V celkovém zhodnocení předložené diplomové práce vynikají zejména dvě věci. První je pečlivost a detailnost zpracování všech použitých metod a provedených časově náročných experimentů, druhou je šíře záběru z hlediska množství studovaných metod a výběru vhodných kandidátů popř. jejich sloučení. Přidanou hodnotou uchazeče, nikoli však diplomové práce samotné, je i několik vlastních publikací na mezinárodních konferencích. Předložená diplomová práce má po odborné i formální stránce výbornou úroveň a lze říci, že svoji kvalitou vybočuje z obvyklých mezí. Práci doporučuji k obhajobě a hodnotím stupněm A.
eVSKP id 52654