JANEČKA, O. Automatické počítání bodů ve hře Divukraj [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Vaško, Marek

Pán Janečka na bakalárskej práci pracoval priebežne počas celého semestra. Významným prínosom je najmä vytvorenie vlastnej dátovej sady, ktorá slúžila ako základ pre trénovanie a testovanie jednotlivých modelov. Oceňujem aj prístup pri experimentoch s finálnym systémom, každé stretnutie prinieslo nové výsledky z rôznych konfigurácií modelov a spôsobov generovania dát. Miernou slabinou bolo dokončovanie práce, kde práca bola intenzívnejšie dokončovaná s blížiacim sa termínom odovzdania. Celkovo však hodnotím prácu pozitívne hlavne s dôrazom na samostatnosť a prínos vytvorenej dátovej sady. V hodnotení navrhujem známku B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání V rámci riešenia zadania sa študent musel oboznámiť s pokročilými metódami spracovania obrazu, ako detekcia objektov a klasifikácia, ktoré presahujú rámec štandardného učiva bakalárskeho študijného programu. Pre riešenie vytvoril dátovú sadu pre klasifikáciu a detekciu kariet v spoločenskej hre Divukraj . Na základe tejto sady realizoval experimenty s cieľom nájsť vhodné konfigurácie funkčných prvkov v systéme na vyhodnocovanie počtu bodov. Z môjho pohľadu boli všetky body zadania splnené. Vo výslednom riešení si pán Janečka osvojil súčasné techniky spracovania obrazu, je schopný porovnávať rôzne prístupy a na základe získaných poznatkov ich integrovať do funkčného celku.
Práce s literaturou Pán Janečka pracoval prevažne s literárnymi zdrojmi, ktoré si vyhľadal samostatne, s minimálnou potrebou usmernenia. Preukázal iniciatívu pri vyhľadávaní relevantných prameňov týkajúcich sa súčasne používaných metód detekcie, ako aj prác s tematickým zameraním blízkym riešenej problematike.
Aktivita během řešení, konzultace, komunikace Konzultoval pravidelne v približne dvoj-týždňových intervaloch. Na každej konzultácii prezentoval svoje pokroky v riešení.
Aktivita při dokončování Práca bola odovzdaná včas. Väčšina obsahu práce bola konzultovaná.
Publikační činnost, ocenění Nie je známe.
Navrhovaná známka
B
Body
88

Posudek oponenta

Beran, Vítězslav

Autor řešil úlohu detekce a klasifikace karet a malých objektů na herní desce pomocí počítačového vidění. Studijní část se opírá o značně rozsáhlý seznam studijní literatury, zejména vědeckých článků. K řešení si vybral pokročilou architekturu YOLO, kterou dotrénoval pro danou úlohu. Současně vytvořil vlastní syntetickou datovou sadu i vlastní generátor pro její tvorbu. Struktura a logika technické zprávy by mohla být lepší. Výsledné řešení je funkční a spíše rozsáhlé. S ohledem na obtížnější téma, hodnotím, i přes řadu výtek, práci celkově jako velmi dobrou.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Obtížnost záleží na vybraných technologiích. Autor volí využití pokročilých statistických modelů, konkrétně YOLO. Správné použití těchto modelů, jejich dotrénování apod. jsou obtížné úlohy nad rámec běžného bakalářského programu.
Rozsah splnění požadavků zadání Práce navíc obsahuje generátor syntetických dat.
Rozsah technické zprávy Úvody kapitol 3.1 a 3.2 do značné míry opakují jejich obsah. I kapitoly navzájem obsahují některé informace opakovaně a stálo by zvážení mít strukturu např. CNN, Transformery, Transfer learning apod. a v nich pak popsat jak použití k deteci i klasifikaci. Přehled historie vývoje modelu YOLO lze hodnotit jako nadbitečnou a nerelevantní k řešené úloze. Kapitola 7.3 je zbytečná. 
Prezentační úroveň technické zprávy 65 Struktura textu je nevyvážená, některé kapitoly nemají podkapitoly, jiné i pět podkapitol. Logicky by se hodilo následující: teoretická kap. 2 patří do teoretické kap. 3., kap. 8.do kap. 7., kap. 4. do návrhu, kap. 5.4 do implementace atd. Struktura by byla vyváženější a logika obsahu lépe reflektovala rozdělení na převzaté znalosti, vlastní návrh a pak jeho realizaci a vyhodnocení. Kapitola návrh kromě návrhu architektury systému pouze opakuje informace z teorie (už potřetí výhody a nevýhody modelu YOLO, opět popis tvorby datové sady), ale nenavrhuje konkrétní metodický postup: revizi architektur, způsob doučování, nastavení trénování, způsob popisu a aplikace pravidel pro výsledný bodový výpočet apod. Naopak nevhodně do metodického návrhu zavádí implementační detaily, jako jsou názvy implementačních knihoven a nástrojů. Naopak implementace obsahuje popis návrhu postupu generování syntetických scén, nastavení rozložení herní scény, parametry variabilitu geometrických transformací, způsob generování snímku scény, generování anotace apod. A až v implementaci je popis atributů karet a návrh vyhodnocení herní scény.
Formální úprava technické zprávy 75 Typografická i jazyková úroveň práce je dobrá. Pojem transformer bych asi nepřekládal. Ačkoliv je český ekvivalent transformační model vhodný, tento pojem nedoporučuji překládat. Obr. 3.1 obsahuje téměř nečitelné informace. V tabulce 4.1 je část datasetu určena k testování chybně pojmenována jako validační 2 (pozn. pod čarou) .  Metrika mAP@0.5 není vysvětlena. FP , ani FP Rate není roven ( 1-Precision ), viz Obr. 7.1. 
Práce s literaturou 85 Autor čerpá z rozsáhlého seznamu vědeckých prací, které jsou pro dané zadání relevantní. Některé zdroje by stačilo uvést do poznámek pod čarou, zejména zdroje z blogů na internetu. Kap. 3.3 obsahuje velké množství názvů architektur a metod, aniž by byly uvedeny odkazy nebo jejich vysvětlení. Např. parametr patience u mechanismu pro dřívější ukončení trénování není nikde řádně vysvětlen. SW nástroje (jako např. Label Studio [12]) je vhodné uvádět do poznámky pod čarou a ne do studijní literatury. 
Realizační výstup 85 Realizační výstup je velmi kvalitní. Výsledný systém je dobře rozdělen do několika logických částí. Řešení navíc obsahuje vlastní nástroj pro tvorbu syntetického datasetu. Zdrojové kódy jsou dobře strukturované a obsahují podstatné komentáře. Autor se pečlivě věnoval augmentaci dat a dobře se pokusil modelovat reálné problémy, jako jsou např. odlesky karet. Tímto se mu podařilo významně zlepšit přesnost řešení.  Z popisu v návrhu ani v implementaci nakonec není zřejmé, je-li detektor trénován na oba typy objektů (karta, herní prvek) nebo na každý zvlášť, resp. toto není zřejmé ani z popisu vytvořeného datasetu. Experimenty porovnávají různé modely YOLO, aniž by byl uveden jejich rozdíl v architektuře. Také není nikde uvedeno, jak autor trénuje existující model: full fine-tuning (učí se všechny vrstvy), feature extractor (učí se jen poslední vrstvy), transfer learning (náhrada poslední vrstvy podle počtu nových tříd), retraining (celý model se učí znovu), incremental learning (přidají se pouze nové třídy). Bylo by vhodné uvádět v hlavičce zdrojových souborů i autora a datum vytvoření a poslední revize. Výsledné prezentační video by mohlo lépe pracovat s animacemi a titulky, uvést i výsledky přesnosti modelů apod. a mít tak vyšší vypovídající hodnotu. Celkově má realizační část velmi dobrou úroveň a nadprůměrný rozsah.
Využitelnost výsledků Jedná se o práci spíše kompilačního charakteru. Výsledky práce lze dobře využít při tvorbě systému pro jinou deskovou hru podobného typu.
Navrhovaná známka
B
Body
88

Otázky

eVSKP id 164110