COLOGNA, A. Ovládání mobilní aplikace hlasem [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Řešitel pracoval aktivně a konstruktivně na zadání po celou dobu, odvedl velké množství práce a nastudoval a prozkoušel celou řadu různorodých softwarových nástrojů.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Podstatou zadání bylo prozkoumat a zmapovat možnosti tvorby mobilních aplikací ovládaných hlasem. Řešitel neměl za úkol vytvořit aplikaci řešící nějaký jeden problém, ale poskytnout znalosti na základě studia a vlastních experimentů, které umožní budoucí vývoj aplikací s řečenou schopností. Řešitel odvedl velké množství práce a dostupné knihovny opravdu dobře nastudoval a experimenty prověřil, takže jeho výstupem je opravdu kredibilní zpráva o možnostech vyvíjení aplikací pro Android ovládaných hlasem. | ||
Práce s literaturou | Řešitel se musel seznámit se základy a principy zpracování řeči (keyword spotting) a hlavně nastudovat a ovládnout větší počet knihoven a nástrojů. | ||
Aktivita během řešení, konzultace, komunikace | Řešitel pracoval intenzivně po oba semestry a docházel na domluvené konzultace. Řešitel k řešení přistupoval zodpovědně a vždy realizoval domluvené pokroky. | ||
Aktivita při dokončování | Práce byla dokončena včas (s předstihem) a dostatečně konzultována. | ||
Publikační činnost, ocenění | N/A |
S přihlédnutím na náročnost zadání práci hodnotím průměrně. Text by si zasloužil úpravu struktury a jazykovou korekci. Chybí definice metodologie, která by posunula práci více do objektivní a rigorózní roviny. Závěry práce lze v omezené šíři využít a mohou ušetřit čtenáři několik hodin zkoumání a hledání vhodných řešení. Na druhou stranu, by případný integrátor řečového ovladání musel ještě udělat vlastní podrobnější testování na svůj konkrétní případ použití.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Jedná se o obtížnější zadání s prostorem pro vlastní iniciativu studenta, která nebyla využita. Obtížnost shledávám v nutnosti orientace v problematice detekce klíčových slov a také v nutnosti prozkoumání většího množství různých knihoven. | ||
Rozsah splnění požadavků zadání | Výhrady mám k bodu 4, kde ovládání hlasem se rozumí detekční úloha (detekce klíčové fráze). Student ale využil metriku pro vyhodnocení přepisu řeči (úspěšnost přepisu vyslovené fráze). Závěr práce (reportované úspěšnosti) nemusí reflektovat realitu ovládání aplikace hlasem. Chybí mi lepší diskuze různých scénářů použití (online/offline, rychlost odezvy, vzdálený mikrofon, wakeup keyword/dlouhodobé naslouchání, atd.) a doporučení vhodného řešení. | ||
Rozsah technické zprávy | |||
Prezentační úroveň technické zprávy | 65 | Náplň jednotlivých kapitol by mohla být upravena. Kapitola 3 se věnuje analýze knihoven pro ovládání aplikací hlasem, ale některé knihovny se objevují až v kapitole 5. Dále chybí celkové a přehledné zhodnocení vlastností všech knihoven. Chybí jasnější vymezení problému, a z toho plynoucí definice metodologie, datových sad a metrik. Základní popis rozpoznávání řeči není v práci dále využit. Má konkrétní technologie dopad na rychlost, paměťovou náročnost, atd.? V kapitole 5 bych opět čekal podrobnější shrnutí výsledků v širším kontextu a diskuzi vzhledem k definovaným případům použití. | |
Formální úprava technické zprávy | 70 | Text je průměrný, občas se objevují překlepy neodhalitelné spell checkerem, nespisovné tvary a výplňkové fráze (poněkud, poměrně, jak již bylo zmíněno, ...). Občas se vyskytuje přepínání mezi českými a anglickými pojmy (commit, aktualizace). Grafy na konci kapitoly 5 bych preferoval sloupcové. | |
Práce s literaturou | 75 | Student použil běžné množství zdrojů. Mohl však lépe nastudovat problematiku detekce klíčových slov a metodologii jejího měření. Převzaté prvky jsou odlišeny. | |
Realizační výstup | 75 | Student vytvořil aplikaci na spouštění jednolivých knihoven, pro pohodlnější vyhodnocení jejich vlastností (úspěšnost, HW nároky). Vyhodnocení nepovažuji za detailní, protože chybí zmíněná metodologie. Při analýze zátěže CPU mi chybí protokol (kdy byla spuštěná detekce, kdy byl přepnutý jazyk, atd.). Dále mi přijde podezřelé, že u všech měření systém využívá kolem 300-400% CPU zatím co aplikace (která nutně dělá složité výpočty) jen několik desítek procent. V rámci testů se dalo jít více do hloubky (ale to by byla práce spíše na úrovni "magistra"). Student testoval na vlastních řečových záznamech. Nabízí se otázka využití již existujících datových sad. Kód je přiměřeně komentovaný. | |
Využitelnost výsledků | Výsledky jsou použitelné spíš pro hrubou představu a hodnota této práce je hlavně v seznamu knihoven, co se nepodařilo spustit (přeložit). Závěry vzhledem k přesnosti detekce jsou orientační (funguje dobře, funguje, nefunguje). Experimenty byly prováděny na vlastoručně pořízených datech. |
eVSKP id 154396