JAŠEK, F. Predikce a analýza dopravní situace pomocí metod strojoveho učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Götthans, Jakub

Cílem bakalářské práce je se seznámit s metodami strojového učení a poté analýzovat/predikovat dopravní situaci z kamerového obrazu pomocí vhodně zvolené existující nebo vlastní metody. První kapitola obsahuje seznam zkratek a zde není co vytknout. Ve druhé kapitole autor popisuje základní definici strojového učení a jednotlivé typy. Ve třetí kapitola je věnována lineární regresi a snaží se popsat metody pro hledání extrému. Poté se přesune na problematiku učení a vhodné délky učení. Čtvrtá kapitola se věnuje klasifikaci, která je působí velmi neuceleným dojmem, kde vysvětluje prahovou úroveň a poté se věnuje hledání funkce. Osobně bych si dovedl představit v této kapitole lepší provázanost. Pátá kapitola pojednává o neuronových sítích. Nicméně zde není popsáno, co to je neuron a jak je definován. Rovnou se autor věnuje počtu vrstev a váhovým koeficientům. Dále algoritmus zpětného šíření (backpropagation) chyby zde není moc dobře vysvětlen a uniká podstata toho, že se jedná o spočítání rozdílu mezi predikovaným výstupem a správným výstupem a poté je tato chyba postupně převedena do koeficientů vah jednotlivých uzlů. Tento proces probíhá od výstupu ke vstupu. Dále se kapitola věnuje sítím pouze s učitelem, kdy tedy známe přesný výstup systému a tím i počet výstupů sítě. Metoda učení bez učitele je částečně popsaná v šeté kapitole, nicméně zde není uvedeno nic o tom, že se právě jedná i speciální případ neuronových sítí. Kapitola sedmá popisuje speciální případ konvolučních neuronových sítí. Zde bych si dovolil nesouhlasit s tvrzením, že infromace z obrazu jsou automaticky extrahování pomocí konvoluční vrstvy. Informace je extrahována pomocí konvolučního filtru. Dále bych určitě nesouhlasil s tvrzením, že vstupní obrazy do CNN mají malé rozlišení (64x64x1). Toto platí pouze za předpokladu, že provádíme jednoduchou obrazovou klasifikaci, kde námi hledaný objekt tvoří převážnou část vstupního obrazu. Také se používá ke vstupu RGB objekt a tím tedy dojde k změnění dimenze vstupní matice. Tohoto se například využívá v případech, kdy by hledaný objekt v obraze mohl při stupních šedi být nerozeznatelný od pozadí. Dále by bylo dobré zde zmínit, že konvoluční síť se skládá z konvolučních vrstev a poté z plně zapojených sítí, které slouží pro kategorizaci extrahovaných dat. Je zde zmíněna opreace maxpooling, a unpooling, nicméňě další operace v textu uvedeny nejsou. Osmá kapitola popisuje praktickou část a snaží se nastínit problematiku možného řešeníOceňuji zde použití existující Yolo V3 sítě, která by měla sloužit jako dobrý benchmark pro srovnání s vlastním návrhem. Nicméně je škoda, že student nepoužil u obrazových dat augmentační techniky pomocí kterých by si zvětšíl mnohonásobně množství trénovacích dat a nedocházelo by ani k takovém přetrénování sítí. Dále je důležité zmínit to, že student dostatečně nerozlišil výsledky u klasifikace objektů a detekci objektů. U jednoduché klasifikace přesnost udává přesný počet úspěšně detekovaných obrázků, nicméně u detekce více objektů v obraze se používá ukazatel mean average precision, který udává počet detekovaných objektů v daném obraze oproti všem označeným objektům v obraze pro danou kategorii a toto platí u všech detekovaných obrazů, kdy se jedná o průmernou hodnotu ze všech detekcí. V závěru student popisuje, že se mu nepodařilo splnit všechny cíle zadání. Souhrn: Teoretická část obsahuje mnoho nepřesností a působí velice neuceleným dojmem. Při analýze přiloženého kodu bylo viďět, že studentovi se podařilo navrhnout vlastní konvoluční neuronovou síť, ikdyž nedosahovala dobrých výsledků. Dále velmi oceňuji, že se student rozhodl pro implementaci ve frameworku PyTorch, který je obecně složitější než Keras a vyžaduje hlubší znalost dané problematiky. Prácí ubírá mnoho bodů nevyužití augmentace pro zvětšení vstupních dat a zvýšení obecnosti natrénované sítě a tím pádem získat nepřesné výsledky. Dalším nedostatkem je určitě nenastínění možného řešení pro predikování objektů z ucelené sekvence snímků, kdy by bylo ukázáno jak se objekt přibližuje oddaluje a na základě těchto vstupních informací se pokusit predikovat pohyb objektů. Po formální stránce se práce nevyvarovala gramatickým chybám a překlepům. Dále některé obrázky jsou velmi rozmazané (3.1, 4.3, 5.1, 5.2, 5.4, 5.5, 6.2, ) a je zde i velká nesourodost v rozlišení a použité grafice, což je spíše subjektivním dojmem. Odkazy v textu na obrázky jsou špatné (Např. Kapitola 5.2 odkazuje na neexistující obrázek 7, kapitola 5.2.1 obr. 9, atp.) . Nicméně největším nedostatkem shledávám chybějící citace v textu. U poděkování je špatně uvedené datum. Výsledný počet bodů 52/E.

Navrhovaná známka
E
Body
52

Posudek oponenta

Maršálek, Roman

Zadání lze považovat za splněné pouze částečně. Práce se zabývá především analýzou dopravní situace, dle mého ale zcela opomíjí problematiku predikce. Rychlost odezvy systému není v práci analyzována. Ostatně, nedostatky práce sám autor v závěru férově přiznává. Otázkou také je, zda požadavky zadání nebyly poměrně ambiciózní. Práce jako celek působí velmi zmatečným a odbytým dojmem, obsahuje mnoho nepřesností. Zpočátku se v práci vyskytuje také velké množství rovnic, u kterých si dovoluji pochybovat, zda jim autor práce rozumí. V částech, které tvoří jádro práce, např. popis konvoluční sítě, bych naopak matematický popis uvítal. Není mi také jasné, jak je možné chápat „predikci“ na Obr. 8.2 a 8.3. Není jasné, jak je definována metrika „accuracy“ a „loss“, metriky „precision“ a „recall“ naopak definovány byly, ale v textu práce zřejmě nebyly použity. Kapitola 8.3.3.3. není zřejmě ukončená. Obrázky často nemají popsány osy, např. Obr. 5.5, nebo jsou nečitelné. Z formálního hlediska se ve vlastní práci vyskytuje nadměrné množství chyb a nepřesností nebo hovorových výrazů. Např. "regresivní/regresní", "přichází s daleko lepší performancí", "accurancy/accuracy", "60 minutě", "Obrázek"/anglické „Figure“, "set je nadopován jádry", "delta" místo symbolu řecké abecedy, pojem "komplexní/nekomplexní" síť, a mnoho dalších. Autor špatně pracuje s odkazy. U Obrázku 8.1 chybí detailní popis jednotlivých bloků, Obr. 8.2 a 8.3 následují až po 8-5. Formátování na prapor zcela jistě nepřispívá k dobré grafické úpravě práce.

Navrhovaná známka
F
Body
48

Otázky

eVSKP id 133586