HOMZOVÁ, E. Hlasový generátor pro pokročilé embedded systémy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Zadání diplomové práce Bc. Elišky Homzové bylo zadáním, na jehož tvorbě se studentka již od počátku aktivně podílela. Po celou dobu řešení práce byl jasně patrný zájem studentky o řešení tématu práce. Průběžné výsledky řešení své diplomové práce diplomantka také prezentovala na studentské soutěži EEICT 2023, kde získala 2. místo v kategorii: M2 – Industrial Automation, Robotics and Artificial Intelligence. Úkolem práce bylo analyzovat a zdokumentovat metody a principy hlasové syntézy využitelné v současných embedded systémech a to z hlediska výpočetních i paměťových nároků. Studentka následně zvolila k analýze a k dokumentaci hlasový syntezátor Atari520ST Speech Sythesizer V2.0. Analyzovala fungování HW komponenty tohoto počítače, potřebné služby jeho operačního systému i strojový kód původní aplikace pro procesor Motorola 68000. Následně přeportovala funkci původního programu do jazyka C++. Validitu výsledného programu úspěšně ověřila na platformě Intel PC a také na embedded počítači Raspberry Pi Pico. Jako vedoucí práce mohu zodpovědně konstatovat, že požadované cíle práce byly splněny. Studentka zvolila vhodnou prezentační formu v textu práce. Diplomová práce má dostatečný rozsah a odpovídající jazykovou úroveň. Kladně taktéž hodnotím její pracovní nasazení i schopnost průběžné analýzy ohledně dalších kroků práce. Studentka věnovala řešení práce enormní množství času, jednotlivé úkoly si však již v počátcích řešení práce vhodně rozvrhla. Diplomatka má již nyní pracovní návyky a praktické zkušenosti, které převyšují úroveň dnešních absolventů univerzit. Pracovala průběžně a samostatně, ale vždy dbala na nutnost prezentace průběžných výsledků při pravidelných konzultacích. Mohu zodpovědně konstatovat, že mi bylo ctí, s ní spolupracovat. Dosažené výsledky i formální zpracování práce jednoznačně svědčí o inženýrských schopnostech studentky. Předložené práci navrhuji hodnocení: Výborně – A. (100)
Diplomové práce Bc. Elišky Homzové byla zaměřena na implementaci generátoru hlasového výstupu pro embeded systém v jazyce C++ a ověření jeho funkčnosti. Zadání diplomová práce je primárně zaměřeno na analýzu existujících softwarových řešení generátorů hlasu a jejich přenesení do prostředí embedded systémů. Náročnost zadání považuji zejména po časové stránce za nadprůměrnou. Autorka na začátku práce stručně popsala základní principy generování hlasu v počítačových systémech a syntézy řeči z textu. Následně metodou reverzního inženýrství analyzovala generátor hlasového výstupu původně vyvinutý pro počítač Atari 520ST, výsledky analýzy řádně zdokumentovala a popsala způsob generování řeči na počítači Atari 520ST. V této části práce postrádám podrobnější vysvětlení významu jednotlivých sloupců tabulek Tab. 2.2 (str. 23) a Tab. 2.3 (str. 24). Dále mi chyběla zmínka o jiných systémech generování řeči, než je program Speech Synthesizer V2.0. Jako základ embedded systému, pro implementaci knihovny hlasového výstupu, si diplomantka zvolila vývojovou desku Raspberry Pi Pico. Jedná se o cenově dostupnou vývojovou desku osazenou dvoujádrovým mikrokontrolérem RP2040, který se běžně používá při konstrukci embedded systémů. Tuto volbu diplomantky považuji za správnou. Další část práce je věnována vlastní implementaci komponent hlasového generátoru a realizaci softwarové knihovny zahrnující tyto komponenty. V rámci softwarové knihovny diplomantka také implementovala ukládání výstupních hodnot pulsně šířkové modulace do souboru typu .wav, což jí umožnilo porovnávat zvuky generované embedded systémem se zvuky generovanými emulátorem pro počítač Atari 520ST. Diplomantka vytvořila dvě demonstrační aplikace, první generuje z anglického textu zvukový soubor typu .wav, druhá demonstruje funkčnost zvukového generátoru při výstupu na reproduktor. Diplomová práce obsahuje cca 75 stran vlastního textu a 14 stran příloh, je členěna do 8 kapitol včetně kapitol úvod a závěr. Práce je sestavena v logickém sledu, má solidní jazykovou a grafickou úroveň. Dle mého názoru diplomantka splnila všechny body zadání práce. Dokázala se v problematice počítačového generování hlasu výborně zorientovat. Prokázala také schopnost využívat odbornou literaturu. Autorka sice vyšla z kódu zvukového generátoru Speech Synthesizer V2.0 pro počítač Atari 520ST, ale protože k tomuto kódu není dostupná dokumentace, musela jej postupy reverzního inženýrství analyzovat a zdokumentovat. Následně dokázala disassemblovaný strojový kód převést na zdrojový kód zapsaný v jazyce C++ a vytvořit knihovnu a aplikaci, kterou je možné provozovat v ebedded systémech. Činnost generátoru mi předvedla. Na základě výše uvedených skutečností hodnotím práci Bc. Elišky Homzové známkou A/90 bodů.
eVSKP id 151799