Ovládání mobilní aplikace hlasem
Loading...
Date
Authors
Cologna, Adam
ORCID
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem této práce je prozkoumat, analyzovat a porovnat dostupné knihovny pro ovládání mobilních aplikací hlasovými pokyny. Zvolený problém jsem dle zadání práce řešil hlavně pro operační systém Android a bral jsem v potaz nejen knihovny pro detekci klíčových slov, ale i knihovny se zaměřením na porozumění řeči. Pro zvolené knihovny jsem provedl testování přesnosti detekce hlasových pokynů a zátěžové testy. Pro potřeby propojení vybraných knihoven vznikla aplikace v moderním programovacím jazyce Kotlin s využitím Jetpack Compose. Hlavním přínosem této práce jsou právě provedené experimenty a výsledná doporučení ohledně zkoumaných knihoven. Mezi nejefektivnější řešení patřila ta od Microsoft Azure a třída Android Speech Recognizer. Hlavními překážkami pro jednotlivé knihovny byla vzdálenost mezi řečníkem a mikrofonem a rušivá hudba v pozadí.
The aim of this bachelor's thesis is to explore, analyze, and compare available libraries for controlling mobile applications with voice commands. According to the thesis requirements, I solved the problem primarily for the Android operating system. I have considered not only libraries for keyword detection but also those using the speech recognition technology. For the selected libraries, I conducted accuracy testing for voice command detection and performance testing. To facilitate the integration of the chosen libraries, an application was developed in the modern programming language Kotlin using Jetpack Compose. The main contribution of this work is the experiments carried out and the resulting recommendations regarding the examined libraries. Among the most effective solutions were those from Microsoft Azure and the Android Speech Recognizer class. The main obstacles for each library were the distance between the speaker and the microphone, as well as distracting background music.
The aim of this bachelor's thesis is to explore, analyze, and compare available libraries for controlling mobile applications with voice commands. According to the thesis requirements, I solved the problem primarily for the Android operating system. I have considered not only libraries for keyword detection but also those using the speech recognition technology. For the selected libraries, I conducted accuracy testing for voice command detection and performance testing. To facilitate the integration of the chosen libraries, an application was developed in the modern programming language Kotlin using Jetpack Compose. The main contribution of this work is the experiments carried out and the resulting recommendations regarding the examined libraries. Among the most effective solutions were those from Microsoft Azure and the Android Speech Recognizer class. The main obstacles for each library were the distance between the speaker and the microphone, as well as distracting background music.
Description
Citation
COLOGNA, A. Ovládání mobilní aplikace hlasem [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Dr. Ing. Dušan Kolář (předseda)
Ing. Vladimír Bartík, Ph.D. (člen)
Ing. Jaroslav Dytrych, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)
Date of acceptance
2024-06-12
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení