JANÍČEK, O. Segmentace silnic a cest v obrazových datech pro účely autonomní jízdy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Svědiroh, Stanislav

Téma práce bylo koncipováno tak, aby bylo možné zpracovat vícero způsoby s různou obtížností. Student si vybral jednu z jednodušších a tím pádem i méně propracovaných metod, nicméně vytvořil funkční řešení, o jehož využití v praxi by se dalo za splnění specifických podmínek uvažovat. Student po celou dobu na problému pracoval samostatně, svá rozhodnutí konzultoval a text práce pravidelně poskytoval pro připomínkování. Teoretická část práce vypovídá o dostatečném pochopení problematiky zadané úlohy a nejčastějších přístupů k jejímu řešení včetně jednotlivých výhod a nevýhod. V praktické části se student rozhodl vydat cestou “klasického” zpracování obrazu, tedy bez využití neuronových sítí nebo hlubokého učení. Navržená metoda je v principu správná, její robustnost však postačuje pouze pro jízdu rovně na relativně prázdné, značené vozovce. Algoritmus má problém v zatáčkách, kolonách, neznačených cestách či ve snížených viditelnostních podmínkách. Parkové cesty se bohužel studentovi touto metodou detekovat nepodařilo, což ve své práci zdůvodňuje. Zhodnocení odvedené práce a porovnání s existujícími metodami bohužel hodnotím jako průměrné. Student sice na mé doporučení vytvořil histogram rychlosti zpracování jednotlivých snímků, který ukazuje průměr okolo 40 snímků za sekundu se značným rozptylem, který bohužel student nikterak neanalyzoval a nezamýšlel se nad jeho příčinou. Dále v tabulce 2.1, která porovnává rychlost jeho řešení s ostatními, uvádí, že rychlost je 83 snímků za sekundu. Z histogramu je ale patrné, že tohoto dosáhl jen v

Navrhovaná známka
C
Body
74

Posudek oponenta

Cihlář, Miloš

Student Ondřej Janíček odevzdal bakalářskou práci rozčleněnou do 2 kapitol. V první teoretické části se věnuje obecně počítačovému vidění, základním metodám segmentace obrazu a v poslední podkapitole zmiňuje metody používané k detekcí silnic a cest. Student popisuje nejlepší metody založené na neuronových sítích a nejlepší klasické metody otestované na KITTI datasetu. Tímto student splnil první bod zadání. Práce má od úvodu po závěr 33 stran a splňuje tak minimální doporučený rozsah bakalářské práce. Formální stránka práce je spíše průměrná. V prvních kapitolách jsou obrázky umístěny bez významného popisu, jak u obrázků, tak v samotném textu je autor vůbec nezmiňuje. Kvituji využití LaTeXu, ovšem odevzdaná práce je vysázena oboustranně, ale tisknuta jednostranně. V práci se proto vyskytují volné listy, a každá druhá stránka je vysázena do vazby. Jednotlivé kapitoly na sebe logicky navazují. Práce je bez gramatických chyb a obsahuje menší množství překlepů. Práce studenta s literaturou je na nízké úrovni. V první části teoretické části student téměř vůbec necituje; první kapitoly obsahují pouze šest citací, vyjma obrázků, na sedmi stránkách textu. Student necituje ani velmi pravděpodobně převzaté pasáže, například popis Cannyho hranového detektoru, Houghovu transformaci nebo Sobelův operátor. Práce je citována z 44 zdrojů, některé z nich jsou kvalitní časopisecké publikace. Druhým bodem zadání je diskutovat výhody a nevýhody jednotlivých algoritmu. Autor zmínil dvě metody segmentace založené na neuronových sítích, jejichž robustnost je hodnocena podle F-skóre, přičemž její hodnoty u jednotlivých přístupů nejsou zmíněny. Dále student zmiňuje dvě nejrychlejší metody. U tohoto bodu mi chybí vzájemné porovnání robustnosti a rychlosti. Bod zadání je splněn. Student shromáždil jako testovací dataset 8 videí, z nichž jeden je z KITTI datasetu, 4 z Brno Urban Datasetu a 3 parkové cesty, které student pravděpodobně natočil sám. Dataset obsahuje různé světelné podmínky a různé druhy silnic a cest. Dataset je dostatečný pro ověření robustnosti navrhnutého řešení. K bodu zadání 4 student implementoval v jazyku Python algoritmus na detekci silnic. Algoritmus je založený na klasických metodách počítačového vidění, bez použití neuronových sítí. Student v kapitole 2.2 a 2.3 objasňuje důvody zvolení daného programovacího jazyka a knihoven, které k implementaci používal. Volby, které student vybral, jsou pro daný úkol relevantní a správné. Algoritmus je založený na Cannyho hranovém detektoru a Houghově transformaci. Student nejprve detekoval hrany v celém obraze, které později filtroval pomocí „pětiúhelníkové masky“ tak, aby zůstaly jen hrany v předpokládaném výskytu cesty, která se má nacházet ve středu obrazu. Toto řešení nepovažuji za příliš šťastné, neboť si tímto krokem student plně zavírá dveře ke správné segmentaci silnice v zatáčkách. Po aplikaci Houghovy transformace byly filtrovány horizontální čáry podle sklonu přímky. Byly odstraněny takové hrany, které mají sklon blízký 0. Posledním krokem algoritmu je průměrování zbylých čar v obraze podle sklonu přímky, která by měla odlišovat pravou a levou stranu silnice. Tento přístup je málo robustní a bude fungovat jen v ideálních podmínkách a na cestách s kvalitním vodorovným dopravním značením, což autor v kapitole „Výsledky testování algoritmu“ taktéž deklaruje. V zadání sice není deklarováno zda měl být detekován jen jízdní pruh, nebo celá silnice, ale autorovým řešením ovšem nedostaneme, v případě silnice s více než dvěma čárami, ani jeden případ a okraj silnice nebo pruhu je vypočítán někde na cestě, často uprostřed jízdního pruhu. Program na přiloženém flashdisku, tak jak byl odevzdán, se na žádném přiloženém videu z datasetu nedokončí, u některých videí spadne hned u prvního framu. Po drobné úpravě kódu je již algoritmus bez problému. Detekce parkových cest nefunguje vůbec, i přestože zadání na ně klade důraz. Zadání je přes výhrady splněno. Autor ve vyhodnocení robustnosti specifikuje případy za kterých algoritmus funguje. Hodnocení je vágní a není popsána žádná metrika, nebo mezní případy kdy je výstup algoritmu považován za správný a kdy nikoli. Autor v poslední tabulce deklaruje, že jeho algoritmus vypočítá jeden frame za 12ms, což odpovídá 80Hz. S přihlédnutím k histogramu na obrázku 2.13 a odevzdanému kódu se jedná o nejlepší možný odhad, a obávám se, že reflektuje případ, kdy nebylo nalezeno řešení a většina výpočtů nebyla provedena. Všechny body zadání byly splněny a práce svědčí o bakalářských schopnostech studenta. Práci doporučuji k obhajobě. Celkové hodnocení D / 60 bodů.

Navrhovaná známka
D
Body
60

Otázky

eVSKP id 159863