Rozpoznávač izolovaných slov pro ovládání elektronických slovníků

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato bakalářská práce se zabývá sestavením rozpoznávače izolovaných slov pro elektronické slovníky. Fonémový rozpoznavač je realizován pomocí HTK (Hidden Markov Model Toolkit). Na začátku tohoto dokumentu jsou stanoveny základní cíle práce. V následující kapitole je teoretický rozbor, který se věnuje procesu rozpoznávání izolovaných slov pomocí skrytých Markovových modelů. Další kapitola se věnuje specifikaci řečových dat, která byla použita pro testování rozpoznávače. Dále jsou zde popsány další prostředky, které byly k dispozici pro sestavení rozpoznavače, jako modely, slovník a gramatika. Před sestavením rozpoznávače bylo třeba vyřešit převod mezi sadou fonémů která byla použita ve slovníku a mezi sadou, kterou používá rozpoznávač. Rozpoznavač byl nejprve sestaven s použitím 8~kHz modelů, později 16~kHz. Byly použity normalizační techniky a technika adaptace na mluvčího. Získaná data byla zpracována a výsledky jsou zhodnoceny v samostatné kapitole. V závěru je diskutováno, zda bylo dosaženo vytýčených cílů a jaké jsou další plány vývoje aplikace.
This work is concerned with creation of isolated word recognizer for electronic dictionaires, testing its functionality on data sample and improvement by normalisation and speaker adaptation techniques. Word recognizer is built on HTK (Hidden Markov Model Toolkit). At the beginning of this document, the main aims of the work are set. In the next chapter is theoretical analysis, which describes process of recognition of isolated words with hidden Markov models. Next chapter specifies the speech data, which were used for testing. Other resources for building recognizer, like models, dictionary and grammar are described in next chapter. Before creation of recognizer, it was necessary to solve conversion between the phonemes set which was used in dictionary and set, which uses the recognizer. The recognizer was built with 8~kHz models first, than 16~kHz models were also used. Normalisation and speaker adaptation techniques were used. Obtained data were processed and results are analyzed in separate chapter. Finally is discussed, if the goals of the work were reached and what are the next steps of application development.
Description
Citation
HRDLIČKA, P. Rozpoznávač izolovaných slov pro ovládání elektronických slovníků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
Date of acceptance
Defence
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO