KÁN, D. Automatická vizuální podpora pro Q-řazení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Vaško, Marek

Pán Dávid Kán pri riešeni práce získal znalosti z oblastí počítačového videnia, spracovania obrazu a strojového učenia. Výsledkom jeho práce je dátová sada pre detekciu kartičiek využívaných pri Q-Sort metodike. Ako výsledok jeho čninnosti zároveň vznikol systém pre detekciu, prepis a evidenciu vhodný pre využitie pri Q-Sort metodike. Negatívne hodnotím hlavne aktivitu pri konzultáciách a experimentovaní s navrhnutým systémom. Celkovo teda navrhujem známku C.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadanie je výskumného charakteru. Riešiteľ mal za úlohu vytvoriť systém pre detekciu, prepis a evidenciu kartičiek využívaných pri Q-Sort metodike. Účelom práce bolo vytvoriť dátovú sadu na experiemnty a vyskúšať rôzne metódy pre detekciu a prepis, ktoré vedú k čo najlepším výsledkom. Riešiteľ k tomuto účelu vytvoril vlastnú dátovú sadu a návrhol systém pre detekciu a prepis kartičiek do štruktúry vhodnej pre ďalšie spracovanie.
Práce s literaturou Riešiteľ preskúmal problematiku do hĺbky a využíval zdroje poskytnuté mnou a zároveň zdroje, ktoré našiel z vlastnej iniciatívy. Využité zdroje sú relevantné k riešenej problematike. Pri riešení bakalárskej práce sa riešiteľovi podarilo preskúmať problematiku počítačového videnia a detekcie objektov v obraze.
Aktivita během řešení, konzultace, komunikace Práca bola riešená počas celej doby, avšak konzultácie boli iniciované zväčša z mojej strany. Aktivita a celkový pokrok počas druhého semestra bol výrazne menší, ako v prvom semestri.
Aktivita při dokončování Práca bola dokončená včas. Obsah technickej správy bol z časti konzultovaný, nie však vo finálnej podobe. Práca bola dokončená na poslednú chvíľu.
Publikační činnost, ocenění N/A
Navrhovaná známka
C
Body
75

Posudek oponenta

Hradiš, Michal

Student do jisté míry úspěšně vyřešil zadanou úlohu, která je zajímavá a kombinuje několik technik počítačového vidění. Samotná úloha, cílové použití a požadavky ale nejsou dostatečně přesně definované, vyhodnocení není úplně přesvědčivé a z textu není jasné, jestli student experimentovat při vývoji, případně jestli v experimentech postupoval důsledně. Struktura textu a obsah kapitol nejsou ideální a pro čtenáře není jednoduché přesně pochopit funkci vytvořeného software.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání Z textu práce není patrné, že by student "Iterativně vylepšoval navržený systém". Vyhodnocené je jen výsledné řešení. Práce neobsahuje žádné další experimenty nebo srovnání. Je otázka, jestli jsou použité datové sady vhodné - například pravděpodobně žádná testovací data nepochází z reálného experimentu Q-řazení prováděné někým jiným než autorem. V práci není dostatečně popsané cílové použití, což ztěžuje zhodnocení vhodnosti datových sad.
Rozsah technické zprávy Část 2.2 Konvolučná Neurónová sieť nepřináší čtenáři žádné informace potřebné pro pochopení práce.
Prezentační úroveň technické zprávy 57 Struktura práce a pochopitelnost pro čtenáře jsou horší. V práci chybí jasná definicie úlohy, kterou se snaží vyřešit. Chybí přesná definice vstupů, přibližné požadavky na přesnost i jasný způsob využití. Například není ani jasné, proč má aplikace pracovat real-time. Popis konvolučních sítí není potřebný pro pochopení řešení (2.2). Sporná je i potřebnost některých sekcí v kapitolce 2.3 Detekce objektů, protože text dále s těmito informacemi většinou nepracuje. Naopak detektoru YOLOv8, který je v práci jako jediný využit, je věnováno překvapivě málo místa.  2.4 Optical Character Recognition neobsahuje moc informací relevatních k OCR software, který student použil. Kapitola "Návrh řešení" obsahuje překvapivě málo detailů (chybí navržené algorimmy) a nejsou jasné důvody pro některé volby při přípravě datové sady. Kapitola Implementace kombinuje popis implementace (i konkrétních funkcí) a samotné funkce (i na úrovni algoritmu).  Nepochopil jsem, jak funguje algorimus "Hľadanie pozície objektov v tabuľke" nebo co je "tvorba tabuľky" (zobrazení tabulky?).
Formální úprava technické zprávy 65 Práce je naspaná slovensky, tak se její jazykovou úroveň neodvažuji hodnotit, ale text odpovídá odbornému stylu. Po typografické stránce práce obsahuje několik problémů a celkově nepůsobí precizně. Nejočividnějším problémem jsou obrázky vemi nízké kvality (rasterové, nízké rozlišení, jpeg komprese, ClearType text anti-aliasing). Okdazy na prvky textu jsou často označené jen číslem, (např. 2.5) bez určení, zda se jedná o obrázek, rovnici nebo kapitolku. Na obrázky 2.10, 2.11 a 2.12 nejsou v textu odkazy.
Práce s literaturou 75 Práce se odkazuje celkem na 31 zdrojů na témata Q-řazení, konvolučních sítí, detektorů a OCR. Tyto zdroje jsou pro práci dostetečné. Zdroje jsou v textu často uváděny na konci odstavce. Některé pasáže by si zasloužily přidat zdroje, protože není jasné, odkud informace pocházejí (např. začátek kapitolky 2.3 nebo metriky v kapitolce 3.3).
Realizační výstup 70 Student vytvořil pravděpodobně funkční systém schopný lokalizovat kartičky v obraze při q-řazení. Oceňuji, že se snažil vyhodnotit úspěšnost různých částí systému a vytvořil k tomu vlastní nástroje. Naopak problém mám s tím, že testovací sady nejsou realistické, některá vyhodnocení nejsou pravděpodobně správná (PRC) a nejsou definované požadavky na systém a jeho přesné použití. Samotný program generuje obrázky nebo videa, přičemž není jasný jejich účel. Podle textu práce se zdá, že student nevyzkoušel různé varianty algoritmů zpracování, a že natrénoval pouze jeden detektor kartiček. 
Využitelnost výsledků Student přistupoval částečně inovativně k danému problému. Získané informace, kód i datová sada mohou být dále využity, ale práce mě příliš nepřesvědčila o kvalitách žádné z těchto částí. 
Navrhovaná známka
D
Body
65

Otázky

eVSKP id 157023