LUČANSKÝ, P. Základy detekce osob v obrazu pomocí metod strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.

Posudky

Posudek vedoucího

Horák, Karel

Bakalářská práce pana Petera Lučanského se týkala tématu detekce chodců ve snímku pomocí metod strojového učení. Podstatnou okolností práce je, že student musel znalosti oboru nastudovat od nuly, protože specificky zaměřený předmět na strojové učení je až v magisterském studiu. Vzhledem k tomu oceňuji práci pana Lučanského s literaturou a online zdroji. Forma zpracování teoretické části mohla být přehlednější a pečlivější. V praktické části si student počínal také celkem dobře. K implementaci vybral CNN platformu na bázi YOLOv3, sestavil z věřejně dostupných datasetů Inria a COCO vlastní trénovací a testovací dataset a jako výpočetní kapacitu vzhledem k absenci nákladného vlastního hardware v podobě GPU použil dostupný Google cloud. Experimentů mělo být ale provedeno víc pro optimální parametrizaci algoritmu jak z pohledu časových nároků na trénování sítě tak z pohledu přesnosti následné detekce chodců v neznámých obrazových datech. Výtkami jsou pouze z věcného pohledu ne zcela optimální časové rozvržení aktivit (příliš času na studium, málo na implemenbtaci a testy) a z formálního pak místy netechnické formulace či gramatické chyby. Dokument práce však splňuje požadavky na bakalářskou práci.

Navrhovaná známka
C
Body
75

Posudek oponenta

Klečka, Jan

Bakalářská práce pana Petera Lučanského se zabývá tématem detekce chodců v obrazu pomocí konvolučních neuronových sítí. Dokument práce se drží předepsané šablony a je psán v anglickém jazyce. Text práce obsahuje přijatelné množství gramatických chyb a místy jsou věty poměrně nešikovně poskládány, ale celkově je práce bez problémů čitelná. Z formálního hlediska mám drobné výhrady. Evidentně převzaté obrázky jsou v práci uvedeny bez citace. V práci se vyskytují nulové čísla podkapitol. Konkrétně jde o kap. 2.0.1-2.0.4. Titulky do textu vložených objektů nejsou umístěny dle zažitých tendencí: několik obrázků má titulek nad sebou, jediná tabulka má titulek pod sebou. Z odborného hlediska je třeba zmínit, že teoretický rozbor dokládá, že autor se ve složité a rychle se rozvíjející problematice konvolučních neuronových sítí dobře orientuje, ač musím vytknout, že se v popisu vyhýbá jakémukoliv náznaku matematiky a navíc zapomíná definovat některé klíčové termíny např. mAP. Při návrhu řešení autor vhodně vybral síť i datasety. Z datasetů pak vhodně vybral obrázky pro trénovaní. Kladně hodnotím jak skutečnost, že do trénovacího datasetu byly záměrně zařazeny i snímky, na nichž žádné osoby nejsou, tak řešení problému s nedostatečným výpočetním výkonem využitím cloudového řešení, tak i trénování sítě na různě velkých datasetech. Co však musím hodnotit negativně je, že práce postrádá pečlivé zhodnocení výsledků. Klasifikované snímky z trénovací množiny jsou sice v elektronické příloze na CD, a tím dokládají funkčnost implementovaného řešení, ale jediné zhodnocení, které jsem v dokumentu našel je v závěru, kde autor jedinou větou uvádí, že bylo dosaženo 69% mAP, což nesebekriticky hodnotí výrazem „outstanding“. Mou poslední výtkou je, že autor zaměňuje termíny true negative a false negative. Fig. 3.10 (c) a 3.13 (b) oba vyobrazují false negative výsledek, ale jsou označeny jako true negative – osoba na obrázku je, ale síť indikuje, že tam žádná není. I přes uvedené výtky zadání bylo dle mého názoru splněno v plném rozsahu a práce svědčí o bakalářských schopnostech autora. Navrhuji hodnocení C/75

Navrhovaná známka
C
Body
75

Otázky

eVSKP id 119330