JURČÍK, A. Aplikace pro záznam fotek a videoklipů ovládaná hlasem [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Řešitel pracoval rovnoměrně po oba semestry řešení a navrhnul a vytvořil aplikaci, která je základním řešením zadaného problému. Investované úsilí a kvalita vytvořeného řešení byly průměrné.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Cílem práce bylo vytvořit aplikaci, která by umožňovala pořizovat fotografie v situacích, kdy uživatel nemůže z různých důvodů mačkat tlačítka na obrazovce nebo okraji telefonu. Podařilo se mu vyvinout základní řešení. | ||
| Práce s literaturou | Řešitel se musel seznámit s problematikou rozpoznání řeči (jmenovitě keyword spotting) a vyhledat a nastudovat knihovny, které potřebné řešení implementují. Musel se také samostatně seznámit s problematikou vývoje mobilních aplikací a iterativně dát dohromady funkční řešení. | ||
| Aktivita během řešení, konzultace, komunikace | Řešitel pracoval rovnoměrně po oba semestry řešení. Množství času, úsilí a vykonané práce bylo průměrné. Řešitel docházel na domluvené konzultace. | ||
| Aktivita při dokončování | Práce byla dokončena včas a dostatečně konzultována a textová zpráva byla několikrát i výrazně přepracována. | ||
| Publikační činnost, ocenění | Řešitel umístil vytvořenou aplikaci na Google Play a jednotky uživatelů ji i využívají. |
Pan Jurčík prokázal, že je schopný se zorientovat v dostupných technologiích a s využitím knihoven pro rozpoznávání hlasu naprogramovat Android aplikaci pro pořízení fotografie a krátkého videa, což je povedenější část jeho práce. Chaotická technická zpráva a úroveň vyjadřování mé celkové hodnocení stahují téměř až na hranici akceptovatelné bakalářské práce.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Téma spojuje více oblastí. Vyžaduje porozumění základním principům rozpoznávání hlasu a hlasového ovládání aplikací, nastudování principů návrhu a testování UI/UX a jejich využití při tvorbě demonstrační aplikace a samotný vývoj mobilní aplikace pro Android s využitím dostupných technologií. Hloubka, do jaké se student do těchto oblastí ponoří pak významně ovlivňuje obtížnost zadání. Autor ovšem zůstal spíše na povrchu. | ||
| Rozsah splnění požadavků zadání | Třetí bod zadání, Vyhledejte a popište techniky pořizování fotografií a krátkých videoklipů na zvolené mobilní platformě, student splnil necelou jednou stranou v rámci popisu implementace (str. 26 a 27). Ostatní body zadání lze považovat za splněné. | ||
| Rozsah technické zprávy | Rozsahem se technická zpráva pohybuje na hranici minimálních požadavků. Informační přínos některých pasáží je navíc minimální. Kapitola 2.1 velmi zmateně popisuje principy rozpoznávačů hlasu založených na HMM či neuronových sítích a zcela opomíjí, pro téma zásadní, úlohu detekce klíčových slov (tzv. Keyword Spotting). Naprosto zbytečné je vysvětlovat, že si pro vývoj Android aplikací musím stáhnout Android Studio a založit projekt. Technická zpráva bakalářské práce není tutoriál pro začínající programátory. | ||
| Prezentační úroveň technické zprávy | 35 | Prezentační úroveň technické zprávy je velice slabá a nehodná absolventa bakalářského studia. Autor chrlí text bez rozmyslu, v rámci jednoho odstavce skáče mezi tématy a nesnaží se text postupně logicky vystavět a oddělit dílčí myšlenky. Příkladem je pasáž: "Tento Problém lze vyřešit jazykovým modelem, pokud uživatel mluví ve větách, jelikož se model opraví. Avšak když používáme jen klíčové slova potenciál, jenž nám nabízí kontrola textu, nelze využít. Jelikož jednoslovné věty nemají žádný smysl. Jedná se už o pátou verzi a není špatná, podporuje dokonce rozpoznání klíčových slov a dokáže je určit, ale není tak dokonalá jako sada od firmy Picovoice." Některé věty působí jako strojový překlad z angličtiny: "Z těchto důvodů je potřeba neuronové síti umožnit časový prostor a nabídnout různá zvuková data ke zhodnocení." Pro text jsou typické zvláštní konstrukce vět, které jsou těžko pochopitelné: "Pro výběr fonému se používá Gaussova křivka. Podle tohoto řešení dokáže akustický model rozlišit, o které skupiny nebo jednotlivé fonémy se jedná. HMM je převodník fonémů, což je jiný název pro stavový model. Určení správného stavu lze docílit, použitím odměn či cen, při změně stavu." Požadavky na aplikaci, a tím pádem i technologie, by bylo lepší dát do samostatné krátké motivační kapitoly a nikoliv do popisu existujících knihoven. Kapitola věnovaná návrhu je mix návrhu UI aplikace, popisu technické realizace a konkrétní implementace včetně zbytečných ukázek zdrojového kódu. Text doprovází jen minimum obrázků. Některé jsou rastrové a jejich kvalita slabá. | |
| Formální úprava technické zprávy | 45 | Technická zpráva obsahuje množství překlepů a gramatických chyb. Nejtypičtější je nesprávné použití čárek v souvětích: "Uživatel ji stáhne avšak, rozpoznání nebude fungovat." | |
| Práce s literaturou | 70 | Literatura není moc rozsáhlá, ale pokrývá témata, která autor řešil, tj. knihy o návrhu a testování UI/UX, dokumentace k vývoji aplikací pro Android, dokumentace k Android knihovnám pro rozpoznávání hlasu. Autor v textu minimálně cituje literaturu, ze které čerpal. | |
| Realizační výstup | 65 | Realizačním výstupem jsou dvě Android aplikace, které byly použity pro testování s uživateli. Aplikaci VoiceCamera tvoří dva zdrojové soubory (dohromady asi 500 řádků) a aplikaci VoicePhoto tři zdrojové soubory (cca 1000 řádků). Nejde tedy o rozsáhlé programátorské dílo. Aplikace VoicePhoto je publikována na Android Play a úspěšně jsem ji nainstaloval. Aplikace umožňuje pořídit krátké video nebo fotku pomocí klíčových slov, je jednoduchá a v tichém prostředí mi fungovala dobře. Samotnému testování je však věnovaná pouze jedna strana (kap. 5.4) a až zpětně člověk pochopí, že výsledky uvedené v kapitole 2.4 Výběr a testování jsou právě výsledky testování s demonstračními aplikacemi. Bohužel, chybí podrobnější popis průběhu testování. Byly definovány testovací scénáře? Jak probíhal sběr zpětné vazby? Hodnotili uživatelé, jak je aplikace použitelná? Jak byla vyhodnocena úspěšnost detekce? Hodnotil jste i případné falešně pozitivní detekce klíčových slov? | |
| Využitelnost výsledků | S ohledem na velmi slabé zpracování výsledků testování s uživateli je praktická použitelnost výsledků práce malá. |
eVSKP id 155071