DELMAR, M. Identifikace aktivit ve videu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Smrž, Pavel

Celkově hodnotím práci jako mírně podprůměrnou, realizační výstup nenaplňuje zcela očekávání a jeho vyhodnocení na aktivitách, které by zajímaly potenciální uživatele, je chabé. Nicméně práce splnila zadání a systém lze, i přes těžkopádné rozhraní, reálně použít.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání vyžadovalo základní pochopení moderních metod počítačového vidění a jejich využití v rámci jednoduchého systému pro rozpoznávání aktivit na záznamech z dohledových kamer. Student s prací začal již před dvěma lety, po prvním semestru ale činnost přerušil a zvýšenou aktivitu začal vyvíjet až v letním semestru tohoto roku. Rozsah technického řešení a, zejména, množství a povahu rozpoznávaných aktivit, jsem si představoval větší, nicméně práce splnila zadání a výstupy jsou akceptovatelné.
Práce s literaturou Student shromáždil a shrnul relevantní materiály, ze způsobu realizace některých částí však není jasné, jestli se mu podařilo hlouběji proniknout a skutečně porozumět zpracované látce.
Aktivita během řešení, konzultace, komunikace Aktivita během řešení byla průměrná, k funkčnímu systému se bohužel student dostal až ke konci letního semestru, takže příležitostné konzultace nevedly k plnému vyjasnění očekávaných způsobů vyhodnocení.
Aktivita při dokončování Práce byla dokončena až poměrně těsně před termínem odevzdání, bohužel jsem neměl už možnost konzultovat definitivní obsah techncké zprávy.
Publikační činnost, ocenění
Navrhovaná známka
D
Body
65

Posudek oponenta

Juránková, Markéta

Student v teoretické části technicky správně popisuje použité metody a nástroje, v praktické části však neprokázal dostatečné pochopení některých konceptů. Výsledný systém splňuje zadání na minimální možné úrovni a chybí důslednější vyhodnocení jeho funkčnosti. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Jedná se o mírně obtížnější zadání, které od studenta bakalářského studia vyžaduje širší rozsah samostudia.
Rozsah splnění požadavků zadání Drobná výhrada se vztahuje k bodu zadání č. 2: ‚Shromážděte dostupné datové sady …‘. Student ve své práci nevyužívá ani nezmiňuje žádnou z aktuálně dostupných datových sad. Pracuje výhradně s vlastními daty, u nichž však chybí informace o jejich rozsahu, variabilitě a dalších charakteristikách.
Rozsah technické zprávy Práce splňuje minimální požadavky na rozsah. Závěr se nachází na straně 36, přičemž popis vlastní práce začíná až na straně 26.
Prezentační úroveň technické zprávy 75 Teoretická část práce je na vysoké jazykové i technické úrovni. I složitější koncepty, jako jsou XCLIP, homografie nebo YOLO, jsou popsány bez chyb a srozumitelně. Na základě vlastní zkušenosti si troufám tvrdit, že jazyková i obsahová úroveň této části výrazně přesahuje běžné znalosti studentů bakalářského studia. V ostrém kontrastu s tím stojí praktická část, která je zpracována výrazně méně kvalitně a postrádá klíčové informace. Vlastní návrh a implementace jsou popsány velmi stručně (pouze na pěti stranách). Chybí zde vysvětlení, jak je získáváno měřítko scény, jakým způsobem se provádí výřez objektu pro použití v modelu XCLIP, jak vypadá použitá datová sada či jak je využíván odhad rychlosti pro úpravu odhadu aktivit. Rovněž u validace systému chybí důslednější vyhodnocení a diskuse výsledků. Z výše uvedeného vyplývá možnost, že pro první část práce byl použit ChatGPT či jiný generativní jazykový model. Tuto skutečnost však student v práci nikde neuvádí.
Formální úprava technické zprávy 95 Práce je na vysoké typografické a jazykové úrovni.
Práce s literaturou 95 Student cituje velké množství relevantních zdrojů. Reference jsou v textu i u obrázků použity správně. Vlastní přínos studenta je od ostatních pramenů řádně odlišen.
Realizační výstup 55 Student pracoval s již předtrénovanými modely. Při implementaci zvolil velmi minimalistické řešení – jedná se pouze o konzolovou aplikaci, která vyžaduje velké množství ručně zadaných vstupních údajů a znalostí o scéně. Validace systému je rovněž velmi stručná – zahrnuje pouze jedno vyhodnocení pěti ručně zadaných aktivit. Ačkoli architektura systému umožňuje rozsáhlé testování různých variant, chybí podrobnější analýza, například: Jak přesnost systému ovlivňuje přidání odhadu rychlosti? Jak přesnost systému ovlivňuje (ne)použití CLAHE? Jaká je přesnost při použití jiných verzí modelů YOLO / XCLIP? Model navíc není testován na žádném z běžně používaných datasetů. Práce obsahuje i několik koncepčních chyb: Při využití homografie pro výpočet rychlosti je promítán střed ohraničujícího boxu objektu, nikoliv bod ležící na promítané rovině. Výřez kolem objektu je dynamický a objekt se v něm vždy nachází uprostřed, což může ovlivnit kvalitu vstupu do modelu. Celý program je napsán v jednom souboru, což výrazně zhoršuje čitelnost a udržovatelnost kódu.
Využitelnost výsledků Jedná se o práci kompilačního charakteru. Student využívá předtrénované modely pro detekci, sledování a extrakci příznaků objektů. V aktuálním stavu aplikace vyžaduje velké množství ručně zadaných parametrů a nastavení, je velmi obtížně použitelná a nabízí jen velmi omezenou funkcionalitu.
Navrhovaná známka
D
Body
60

Otázky

eVSKP id 161218