ZAKAROVSKÝ, M. Detekce dopravních značek pomocí metod strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Horák, Karel

Úkolem práce pana Zakarovského bylo nalézt detekční postup na bázi strojového učení pro nalezení vybraných (příkazových a zákazových) dopravních značek ve snímku. Téma je na bakalářskou práci poměrně komplexní a časově náročné, nicméně potřebné zdroje jsou dostatečně publikované. Kladně hodnotím anglické vyvedení práce a tím snažší sdílení. Uchazeč konzultoval pravidelně, i když ne příliš často, pracoval tedy velmi samostatně. Koncepčně si práci sice rozvrhl správně, nicméně časově kvůli různým prodlevám se k samotné praktické části, která je v tomto případě stěžejní, dostal až v samém závěru akademického roku namísto plánovaného začátku letního semestru. Experimentální část tak zabírá jen 6 stran a z nemalé části jde o ukázky volání funkcí či popis přejaté a vlastní datové sady. Z pohledu vedoucího hodnotím práci stupněm C.

Navrhovaná známka
C
Body
70

Posudek oponenta

Richter, Miloslav

Náročnost zadání je střední po stránce odborné i časové. Zadání nelze považovat za splněné. V zadání je požadavek na detekci a rozpoznání značek v běžném silničním provozu. Použité databáze a nasnímané snímky ovšem obsahují značky, které jsou dominantní částí scény a tedy nezachycují reálný provoz. Stejně tak ověření algoritmů mělo být provedeno na reálných datech ze silničního provozu. Není splněna ani část zadání podle které měla být práce vypracována ve spolupráci s firmou Artin s.r.o., o které se však kromě zadání práce nezmiňuje. V zadání se hovoří o návaznosti na projekt Roboauto od firmy Artin s.r.o. z čehož usuzuji, že mělo dojít k detekci značek ze snímku okolí auta a ne pouze určení (rozpoznání) o kterou značku se jedná. V úvodní části práce mi chybí všeobecný popis úlohy a základních termínů - jak vypadá scéna silničního provozu, k čemu má být aplikace použita ... V další části provedl student rešerši používaných metod pro řešení dané problematiky. Jsou zde uvedeny různé metody pro nalezení značek. Většina zde uvedených řešených příkladů jsou snímky, kde je značka menší než třetina obrázku, na některých snímcích je značek několik - tyto snímky odpovídají snímkům, které měly být řešeny. Metoda CNN, zvolená pro realizaci, nemá vlastní název kapitoly, ale je popsána v kapitole 1.4.1. Jsou zde popsány její základní vlastnosti. CNN je popsána jako nejpřijatelnější metoda z kategorie "deep learning" ale není zde srovnání vlastností s jinými metodami ani kategorie "deep learning" ani jiných kategorií. Na straně 35 je uvedena tabulka, která ukazuje, že algoritmus CNN je horší než algoritmus T-T. O stránku dále se konstatuje, že T-T je nejrobustnější metoda a proto se použije řešení CNN v čemž vidím rozpor. V textu se o T-T píše jako o "Tsinghua-Tencent 100K detection network", na www jsem však našel, že T-T 100K je testovací databáze snímků. Výše zmíněná tabulka 1.1 srovnávající metodu CNN s databází potom nedává smysl. Nedorozumnění vzniklo chybným překladem zdroje, kde autoři srovnávají CNN s jejch vlastní úpravou, kterou nazývají "our approach" a testují na nově vytvořené databázi 100000 snímků pořízených z map Tenceng street, kterou nazvali "T-T 100K". Realizace algoritmů zadání byla provedena minimálním způsobem. Pro řešení byl použit nástroj MATLAB, konkrétně jeho dvě funkce na učení sítě a použití naučené sítě k detekci. Vlastní programové řešení nepřekročilo 200 řádků kódu. Nejdůležitější částí kódu jsou dvě funkce matlabu - první pro naučení sítě podle dodané databáze, s čímž souvisí i příprava struktur s daty (vlastní data jsou asi připravena v databázích stažených ze sítě neboť o jiné alternativě se práce nezmiňuje); druhá funkce slouží k použití naučené sítě k detekci značky na snímku. Doprovodný kód potom zjišťuje úspěšnost detekce. Ke splněné části zadání patří vytvoření vlastní sady snímků. Bohužel student neponechal snímky v původním tvaru, ale vyřízl z nich pouze značky a jejich nejbližší okolí. Pro vybrané značky vytvořil i anotační soubor pro spolupráci s databází. K anotaci použil jméno souboru a typ značky. Je potřeba ocenit, že práce ja psaná v anglickém jazyce. Z textu popisujícího řešení není jasné, zda funkce naprogramoval sám (nahlédnutím do helpu MATLABu je zřejmé, že využil funkce již vytvořené). Kapitola 3.3 popisuje implementaci - není ale jasný význam zde uvedených tabulek. Zda jsou obecným příkladem nebo ukazují stav a hodnoty použité při realizaci. V některých případech není popsáno co hodnoty znamenají, není popsáno jaké mohou mít rozsahy a proč mají nakonec dané hodnoty. Je popsáno několik kroků učení a změn vstupních parametrů z důvodu špatných výsledků - zdůvodnění velikosti změn a výběr měněných parametrů ovšem není popsán. Metoda Pokus/Omyl není vhodným bakalářským přístupem. Předpokládal bych, že výsledkem těchto zkoušení bude předpis (nebo alespoň doporučení či rada) jak postupovat při nastavování parametrů při učení, jakým způsobem se projeví v učení změny jednotlivých parametrů. Z předloženého textu vyplývá, že se síť podařilo naučit a bylo dosaženo rozpoznání značek. V závěru se ovšem konstatuje, že i když byly značky bez výraznějšího okolí, i přesto byla detekce méně kvalitní a jako možná příčina se uvádí velké okolí kolem značek.

Navrhovaná známka
F
Body
47

Otázky

eVSKP id 111119