VLASÁK, J. Webová aplikace pro nastavení ergonomického posedu na jízdním kole [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Čadík, Martin

Celkově považuji předloženou práci za velmi zdařilou. Student navrhl a implementoval funkční webovou aplikaci pro nastavení ergonomického posedu na jízdním kole. V rámci práce dále vytvořil novou datovou sadu a pomocí ní porovnal metody pro odhad pózy postavy cyklisty, jak automatické, tak tradiční tzv. "marker-based".

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání diplomové práce považuji za náročnější. Vedle práce na webové aplikaci, která je implementačního charakteru, vyžaduje zadání také nastudování a porovnání technik pro odhad pózy postavy. Zadání navazuje na semestrální projekt řešený v rámci předmětu VYF - výpočetní fotografie.
Práce s literaturou Student pracoval s literaturou dodanou vedoucím práce a sám si vyhledával další relevantní zdroje. Citované práce jsou často velmi kvalitní vědecké články publikované na prestižních konferencích jako je např. CVPR.
Aktivita během řešení, konzultace, komunikace Student byl během řešení aktivní, dohodnuté termíny dodržoval a na konzultace byl dobře připraven.
Aktivita při dokončování Práce byla dokončena v mírném předstihu a byla konzultována s vedoucím práce.
Publikační činnost, ocenění Práce byla prezentována na studentské konferenci EXCEL@FIT, kde získala ocenění odborné komise.
Navrhovaná známka
A
Body
91

Posudek oponenta

Bobák, Petr

Autor v rámci diplomové práce prostudoval problematiku počítačové podpory ergonomie posedu na jízdním kole a vytvořil přesvědčivé a komplexní dílo, které spojuje množství metod a technologií do jednoho  celku splňujícího zadání práce. Nicméně, vzhledem k výše zmíněným prezentačním nedostatkům navrhuji hodnocení stupněm B .

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Zadání práce je obtížnějšího charakteru. Autor musel nastudovat teorii ergonomie posedu na jízdním kole, problematiku vizuální detekce markerů a automatické detekce odhadu pózy s využitím strojového učení. Součástí práce je mimo jiné i sběr dat pro trénování zmíněné úlohy strojového učení. Navržený přístup detekce pózy jezdce autor následně integroval do webové aplikace, která sama o sobě přinesla řadu dalších výzev, především kvůli komplexnímu výpočtu odhadu pózy pouze na straně klienta.
Rozsah splnění požadavků zadání Splnění třetího bodu je mírně diskutabilní, jelikož autor porovnává dva zadané přístupy pouze vágně a bez kvantitativního vyhodnocení.
Rozsah technické zprávy Rozsahem se práce nachází v obvyklém rozmezí – závěr je uveden na straně 53 (cca 80 normostran).
Prezentační úroveň technické zprávy 80 Logická struktura technické zprávy je v pořádku. V textu se jen zřídka nacházejí drobné faktické nepřesnosti. Pochopitelnost textu je však limitovaná následujícími nedostatky: Z technické zprávy není zřejmé, zdali se výsledky automatického odhadu pózy po dotrénování zlepšily celkově nebo jen na dvou explicitně vyhodnocených klíčových bodech (chodidlo, pata), jelikož výsledky měření pro všechny klíčové body nejsou v textu uvedeny. Autor se při argumentaci výsledků odhadu pózy založeného na strojovém učení odkazuje na velikosti jednotlivých datasetů, jež však v textu nejsou explicitně kvantifikovány. Z textu není jasné, jaký typ loss funkce autor využil pro trénování modelu odhadu pózy. Autor v rámci implementace využívá několik knihoven, mnohdy však rozhodnutí není odůvodněno a porovnáno s alternativami. 
Formální úprava technické zprávy 90 Práce je psána v anglickém jazyce. Po gramatické stránce se v textu nachází pouze menší množství překlepů. Po typografické stránce je formátování textu až na drobné výjimky v pořádku.
Práce s literaturou 90 Autor cituje 40 převážně vědeckých zdrojů relevantních pro řešený problém.
Realizační výstup 85 Výstupem práce je přehledná webová aplikace, která umožňuje vyhodnocení a návrh úpravy ergonomie posedu na jízdním kole z videozáznamu jezdce. Přístup je založen na odhadu pózy cyklisty a následném výpočtu úhlů mezi detekovanými klíčovými body. Součástí realizace je také dataset 23 videozáznamů jednoho jezdce, obsahující více než 2300 snímků. Odhad pózy je realizován pomocí architektury RTMPose, která byla dotrénována na tomto datasetu. Anotace klíčových bodů byly získány pomocí barevných markerů umístěných na těle jezdce. Tato skutečnost však implikuje dva problémy: (1) anotace klíčových bodů v datasetu jsou jen tak přesné, jako je přesnost detekce markerů (v textu však není kvantifikováno), (2) pro trénování modelu odhadu pózy z videozáznamů je třeba jednotlivé markery vymaskovat. Autor použil metodu inpaintingu, jež však dle mého názoru může zavést na aplikovaná místa šum, zjednodušující odhad klíčových bodů při trénování a evaluaci. Výběr modelu pro odhad pózy cyklisty je také diskutabilní. Autor vybral ze škály zvažovaných modelů model RTMPose pouze na základě porovnání nedotrénovaných modelů. Správný postup je však opačný – dotrénovat všechny zvažované modely a až následně vybrat nejlepší. Autor také uvádí, že dotrénování modelu zlepšilo výsledky odhadu u dvou klíčových bodů (chodidlo, pata), ale výsledky pro všechny klíčové body nejsou kvantifikovány. Dále autor uvádí, že vybraný model trénoval pouze jednu epochu, aniž by poskytl evidenci o průběhu delšího trénování. Navzdory těmto nedostatkům a chybějícímu uživatelskému testování je implementovaná webová aplikace technicky propracovaná a uživatelsky přívětivá. Vyzdvihuji, že veškeré zpracování videozáznamů probíhá na straně klienta. Tato skutečnost představila řadu výzev, zejména při získávání jednotlivých snímků a inferenci modelu RTMPose. Autor tyto výzvy nejen zdárně překonal, ale také s využitím vhodných knihoven efektivně implementoval řešení, což významně přispělo k celkové kvalitě a funkčnosti aplikace.
Využitelnost výsledků Realizované dílo je velmi povedené, technicky propracované a veřejně přístupné na https://vlasakjiri.github.io/bikefit/ .
Navrhovaná známka
B
Body
89

Otázky

eVSKP id 154460