Systém pro rozpoznání hlasových povelů v reálném čase
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní.
The bachelor thesis deals with the development of a system for voice command recognition. The classifier of this system was created using a neural network. In this thesis you will learn about the history and problems of speech recognition. A system has been created that detects a section in a recording containing a speech signal, which then uses the classifier to decide what word from the word table it is. Three models with the same architecture but with different training data were created. These models were then compared with each other. A simple user interface was created for the resulting system.
The bachelor thesis deals with the development of a system for voice command recognition. The classifier of this system was created using a neural network. In this thesis you will learn about the history and problems of speech recognition. A system has been created that detects a section in a recording containing a speech signal, which then uses the classifier to decide what word from the word table it is. Three models with the same architecture but with different training data were created. These models were then compared with each other. A simple user interface was created for the resulting system.
Description
Citation
ŠÍBL, E. Systém pro rozpoznání hlasových povelů v reálném čase [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda)
Ing. Jiří Přinosil, Ph.D. (místopředseda)
Ing. Jaromír Mačák, Ph.D. (člen)
prof. Ing. Jana Tučková, CSc., CSc. (člen)
Ing.MgA. Edgar Mojdl, Ph.D. (člen)
Ing. Hicham Atassi, Ph.D. (člen)
Date of acceptance
2022-06-16
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Otázky:
1) V sekcii 1.3.2 ste uviedli obrázok 1.9, ktorý by mal znázorňovať rozdiel medzi koreláciou a konvolúciou. Prosím o stručné vysvetlenie rozdielu medzi týmito matematickými operáciami v súvislosti s uvedeným obrázkom.
2) V praktickej časti práce uvádzate, že ste naučili 3 modely neuronovej siete, každý model na inom datasete, respektíve dataset obsahujúci čisté pôvodné nahrávky, dataset obsahujúci nahrávky s pridanými ruchmi a dataset obsahujúci nahrávky s odstránenými ruchmi pomocou externej funkcie. Všetky 3 naučené modely dosiahli veľmi pekné výsledky. Nikde ale neuvádzate, aký ste zvolili pomer medzi trénovacou, validačnou a testovacou množinou z uvedených datasetov v priebehu procesu učenia. Aký postup ste zvolili na testovanie presnosti naučených modelov?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení