BOČEK, V. Detekce semaforu ve snímku dopravní situace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Práci pana Bočka jsem vypsal v našich podmínkách jako více méně průkopnickou. Zabývá se detekcí semaforů, tj. dopravních světel v obrazu a realizace má být provedena nikoli standardními postupy zpracování obrazu, ale vybranou metodou využívající strojové učení. Detekce semaforu není tak hojně publikována jako např. detekce dopravních značek nebo SPZ, tím spíš v oblasti strojového učení. Z tohoto pohledu odvedl pan Boček kus práce jak při sestavování rešerše tak při dlouhém laborování pro výběr vhodné platformy pro trénování velkého objemu dat a hledání příslušného hardware. Nicméně přístup k řešení problémů mohl být víc koncepční, plánovaný a tím klidnější a méně chaotický. Pan Boček konzultoval dostatečně často, stejně tak často a zejména v posledních měsících pracoval v laboratoři na experimentech pro vyhodnocení datových sad, z nichž jednu sám také pořídil. Pracovitost uchazeče je výborná, koncepční přístup a tím i výsledky průměrné a tak práci hodnotím stupněm B.
Bakalářská práce Václava Bočka se zabývá detekcí semaforů v obraze z běžného silničního provozu a klasifikaci stavu semaforu pomocí konvolučních neuronových sítí. Jedná se o jedno z nejprogresivnějších odvětví strojového učení, kde se za pomoci mnohovrstvých nelineárních výpočetních modelů získává užitečná informace přímo z dat. Bakalář ve druhé kapitole provedl rešerše 4 přístupů a metod k detekci semaforů v obraze a klasifikaci stavu semaforu. Třetí kapitola se zabývá problematikou tréninkové množiny pro učení a testování konvolučních neuronových sítí pro segmentaci a klasifikaci. Bakalář provedl analýzu tří dostupných galerií snímků a vytvořil vlastní galerii „Boček dataset“ anotovaných snímků. Čtvrtá kapitola se věnuje konvolučním neuronovým sítím, popisu topologie a vysvětlení významu a funkcí jednotlivých typů vrstev. V páté kapitole je popsáno zdůvodnění výběru konvoluční neuronových sítí Faster R-CNN (pro segmentaci), AlexNet (pro klasifikaci) a způsob jejich realizace v rámci bakalářské práce. V závěru kapitoly je provedeno zhodnocení dosažených výsledků jednak z hlediska nastavení jednotlivých parametrů pro konvoluční neuronové sítě (detektor, klasifikátor) a dle úspěšnosti správné detekce semaforu a určení jeho stavu. K předložené bakalářské práci mám následující připomínky: 1. Je až zarážející různorodost použité terminologie, která snižuje celkovou kvalitu práce. Např.: trénovací snímky, trénovací množina, trénovací set, trénovací data, trénovací dataset, trénovací datastore, dataset – jaký je správný pojem v češtině? 2. V práci jsou často bez důvodu použity „anglické“ výrazy, které mají v češtině ekvivalentní výraz např. dataset / soubor dat. 3. V Tab. 3-2 jsou ke kriteriálnímu zhodnocení kamer uvedené hodnoty s různým počtem desetinných míst. Proč? 4. Nejednotný popis tabulek např. Tab. 5-2, Tab. 5-9. Autor práce splnil všechny body zadání a musím ocenit, jakým způsobem postupoval při řešení vzniklých problémů při realizaci galerie snímků a konvolučních neuronových sítí. Bakalář vytvořil funkční systém pro detekci semaforu v obraze a určení jeho stavu použitím konvolučních neuronových sítích. Zkušební komisi navrhuji hodnocení B / 81 bodů.
eVSKP id 111120