JURČÍK, A. Aplikace pro záznam fotek a videoklipů ovládaná hlasem [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Herout, Adam

Řešitel nastudoval několik témat nad rámec povinného bakalářského studia a vytvořil aplikaci (dvojici aplikací), která řeší zadaný problém. Řešitel bojoval zejména s psaním textové zprávy a s přesným a přesvědčivým formulováním popisu vlastního řešení.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem práce bylo vytvořit aplikaci, která by umožňovala pořizovat fotografie v situacích, kdy uživatel nemůže z různých důvodů mačkat tlačítka na obrazovce nebo okraji telefonu. Řešiteli se podařilo vyvinout základní řešení.
Práce s literaturou Řešitel se musel seznámit s problematikou rozpoznání řeči (jmenovitě keyword spotting) a vyhledat a nastudovat knihovny, které potřebná řešení implementují. Musel se také samostatně seznámit s problematikou vývoje mobilních aplikací a iterativně dát dohromady funkční řešení.
Aktivita během řešení, konzultace, komunikace Řešitel pracoval rovnoměrně po oba semestry řešení. Množství času, úsilí a vykonané práce bylo průměrné. Řešitel docházel na domluvené konzultace. V termínu pro dopracování práce po neúspěšné obhajobě se ozval se záměrem konzultovat a doptával se na náležitosti textové zprávy.
Aktivita při dokončování Práce byla dokončena včas a dostatečně konzultována a textová zpráva byla několikrát i výrazně přepracována. V termínu pro dopracování práce se řešitel věnoval psaní a snažil se odstranit nedostatky vytknuté původním posuzovatelem a komisí.
Publikační činnost, ocenění Řešitel umístil vytvořenou aplikaci na Google Play a jednotky uživatelů ji i využívají.
Navrhovaná známka
D
Body
68

Posudek oponenta

Španěl, Michal

Pan Jurčík prokázal, že je schopný se zorientovat v dostupných technologiích a s využitím knihoven pro rozpoznávání hlasu naprogramovat Android aplikaci pro pořízení fotografie a krátkého videa. Celkové mírně podprůměrné hodnocení navrhuji s ohledem na nevelký rozsah technické realizace i zmiňované nedostatky v technické zprávě a uživatelském testování.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Téma spojuje více oblastí. Vyžaduje porozumění základním principům rozpoznávání hlasu a hlasového ovládání aplikací, nastudování principů návrhu a testování uživatelského rozhraní, a využití získaných znalostí při tvorbě mobilní aplikace a samotném vývoj aplikace pro Android s využitím dostupných technologií. Hloubka, do jaké se student do těchto oblastí ponoří pak významně ovlivňuje obtížnost zadání. Pan Jurčík do uvedených oblastí pronikl pouze v míře potřebné pro naplnění zadaní.
Rozsah splnění požadavků zadání Třetí bod zadání, Vyhledejte a popište techniky pořizování fotografií a krátkých videoklipů na zvolené mobilní platformě, student splnil necelou polovinou stránky v rámci popisu implementace (str. 24). Ostatní body zadání považuji za splněné.
Rozsah technické zprávy Rozsahem se technická zpráva pohybuje na spodní hranici obvyklého rozmezí. Při popisu realizace autor občas sklouzává k formě tutoriálu a zmiňuje i triviální věci nebo zbytečné detaily.
Prezentační úroveň technické zprávy 63 Prezentační úroveň technické zprávy je dobrá a dostatečně popisuje autorovo technické dílo a jeho realizaci. Požadavky na aplikaci včetně konkrétních scénářů jejího použití by bylo vhodné shrnout v krátké samostatné kapitole. Co přesně za aplikaci(e) vzniká se čtenář dozvídá v průběhu čtení celé zprávy, nebo až si aplikaci vyzkouší. Kapitola věnovaná návrhu zabíhá do detailů konkrétní technické realizace. Jasný přehled funkcí aplikace v ní chybí. Finální testování aplikace s uživateli je trochu nelogicky v kapitole věnované implementaci. Prezentační úroveň by vylepšilo více diagramů navrhované aplikace a její technické realizace.
Formální úprava technické zprávy 60 V technické zprávě se vyskytují překlepy. Až na některé složitější formulace je srozumitelná. Ne vždy autor používá správné pojmy. Na několika místech píše o "souvislostech" aplikace, přičemž zažitý termín jsou závislosti. Také dialogové okno není "modulární", ale modální.
Práce s literaturou 70 Literatura není rozsáhlá, ale pokrývá témata, která autor řešil, tj. knihy o návrhu a testování UI/UX, dokumentace k vývoji aplikací pro Android, dokumentace k Android knihovnám pro rozpoznávání hlasu. Autor v textu minimálně cituje literaturu, ze které čerpal.
Realizační výstup 72 Realizačním výstupem jsou dvě Android aplikace, které byly použity pro testování s uživateli. Aplikaci VoiceCamera tvoří dva zdrojové soubory (dohromady asi 500 řádků) a aplikaci VoicePhoto tři zdrojové soubory (cca 1000 řádků). Nejde tedy o rozsáhlé programátorské dílo. Aplikace VoicePhoto je publikována na Android Play a úspěšně jsem ji nainstaloval. Aplikace umožňuje pořídit krátké video nebo fotku pomocí klíčových slov, je jednoduchá a v tichém prostředí mi fungovala dobře.
Využitelnost výsledků Autor otestoval několika frameworků pro rozpoznávání řeči s cílem vybrat pro implementaci ten nejvhodnější. Také obě aplikace otestoval s 20 uživateli na různých Android zařízeních, což je velmi slušné číslo. Škoda, že se nepokusil testování uchopit exaktněji. Alespoň závěrečný dotazník pro sběr zpětné vazby by byl velmi užitečný pro zhodnocení použitelnosti aplikace, subjektivní hodnocení úspěšnosti detekce, apod. Shrnutí testování aplikací tak tvoří přibližně 1 strana textu a nepředkládá přesvědčivé argumenty o dobré praktické využitelnosti aplikace.
Navrhovaná známka
D
Body
67

Otázky

eVSKP id 162131