DELMAR, M. Identifikace aktivit ve videu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Celkově hodnotím práci jako mírně podprůměrnou, realizační výstup nenaplňuje zcela očekávání a jeho vyhodnocení na aktivitách, které by zajímaly potenciální uživatele, je chabé. Nicméně práce splnila zadání a systém lze, i přes těžkopádné rozhraní, reálně použít.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Zadání vyžadovalo základní pochopení moderních metod počítačového vidění a jejich využití v rámci jednoduchého systému pro rozpoznávání aktivit na záznamech z dohledových kamer. Student s prací začal již před dvěma lety, po prvním semestru ale činnost přerušil a zvýšenou aktivitu začal vyvíjet až v letním semestru tohoto roku. Rozsah technického řešení a, zejména, množství a povahu rozpoznávaných aktivit, jsem si představoval větší, nicméně práce splnila zadání a výstupy jsou akceptovatelné. | ||
| Práce s literaturou | Student shromáždil a shrnul relevantní materiály, ze způsobu realizace některých částí však není jasné, jestli se mu podařilo hlouběji proniknout a skutečně porozumět zpracované látce. | ||
| Aktivita během řešení, konzultace, komunikace | Aktivita během řešení byla průměrná, k funkčnímu systému se bohužel student dostal až ke konci letního semestru, takže příležitostné konzultace nevedly k plnému vyjasnění očekávaných způsobů vyhodnocení. | ||
| Aktivita při dokončování | Práce byla dokončena až poměrně těsně před termínem odevzdání, bohužel jsem neměl už možnost konzultovat definitivní obsah techncké zprávy. | ||
| Publikační činnost, ocenění |
Student v teoretické části technicky správně popisuje použité metody a nástroje, v praktické části však neprokázal dostatečné pochopení některých konceptů. Výsledný systém splňuje zadání na minimální možné úrovni a chybí důslednější vyhodnocení jeho funkčnosti.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Jedná se o mírně obtížnější zadání, které od studenta bakalářského studia vyžaduje širší rozsah samostudia. | ||
| Rozsah splnění požadavků zadání | Drobná výhrada se vztahuje k bodu zadání č. 2: ‚Shromážděte dostupné datové sady …‘. Student ve své práci nevyužívá ani nezmiňuje žádnou z aktuálně dostupných datových sad. Pracuje výhradně s vlastními daty, u nichž však chybí informace o jejich rozsahu, variabilitě a dalších charakteristikách. | ||
| Rozsah technické zprávy | Práce splňuje minimální požadavky na rozsah. Závěr se nachází na straně 36, přičemž popis vlastní práce začíná až na straně 26. | ||
| Prezentační úroveň technické zprávy | 75 | Teoretická část práce je na vysoké jazykové i technické úrovni. I složitější koncepty, jako jsou XCLIP, homografie nebo YOLO, jsou popsány bez chyb a srozumitelně. Na základě vlastní zkušenosti si troufám tvrdit, že jazyková i obsahová úroveň této části výrazně přesahuje běžné znalosti studentů bakalářského studia. V ostrém kontrastu s tím stojí praktická část, která je zpracována výrazně méně kvalitně a postrádá klíčové informace. Vlastní návrh a implementace jsou popsány velmi stručně (pouze na pěti stranách). Chybí zde vysvětlení, jak je získáváno měřítko scény, jakým způsobem se provádí výřez objektu pro použití v modelu XCLIP, jak vypadá použitá datová sada či jak je využíván odhad rychlosti pro úpravu odhadu aktivit. Rovněž u validace systému chybí důslednější vyhodnocení a diskuse výsledků. Z výše uvedeného vyplývá možnost, že pro první část práce byl použit ChatGPT či jiný generativní jazykový model. Tuto skutečnost však student v práci nikde neuvádí. | |
| Formální úprava technické zprávy | 95 | Práce je na vysoké typografické a jazykové úrovni. | |
| Práce s literaturou | 95 | Student cituje velké množství relevantních zdrojů. Reference jsou v textu i u obrázků použity správně. Vlastní přínos studenta je od ostatních pramenů řádně odlišen. | |
| Realizační výstup | 55 | Student pracoval s již předtrénovanými modely. Při implementaci zvolil velmi minimalistické řešení – jedná se pouze o konzolovou aplikaci, která vyžaduje velké množství ručně zadaných vstupních údajů a znalostí o scéně. Validace systému je rovněž velmi stručná – zahrnuje pouze jedno vyhodnocení pěti ručně zadaných aktivit. Ačkoli architektura systému umožňuje rozsáhlé testování různých variant, chybí podrobnější analýza, například: Jak přesnost systému ovlivňuje přidání odhadu rychlosti? Jak přesnost systému ovlivňuje (ne)použití CLAHE? Jaká je přesnost při použití jiných verzí modelů YOLO / XCLIP? Model navíc není testován na žádném z běžně používaných datasetů. Práce obsahuje i několik koncepčních chyb: Při využití homografie pro výpočet rychlosti je promítán střed ohraničujícího boxu objektu, nikoliv bod ležící na promítané rovině. Výřez kolem objektu je dynamický a objekt se v něm vždy nachází uprostřed, což může ovlivnit kvalitu vstupu do modelu. Celý program je napsán v jednom souboru, což výrazně zhoršuje čitelnost a udržovatelnost kódu. | |
| Využitelnost výsledků | Jedná se o práci kompilačního charakteru. Student využívá předtrénované modely pro detekci, sledování a extrakci příznaků objektů. V aktuálním stavu aplikace vyžaduje velké množství ručně zadaných parametrů a nastavení, je velmi obtížně použitelná a nabízí jen velmi omezenou funkcionalitu. |
eVSKP id 161218