Rozpoznávač řeči s omezeným slovníkem

but.committeeprof. Ing. Eva Gescheidtová, CSc. (předseda) doc. Ing. Ivo Lattenberg, Ph.D. (místopředseda) Ing. Václav Křepelka, Ph.D. (člen) Ing. Jiří Prokeš, Ph.D. (člen) doc. Ing. Petr Sysel, Ph.D. (člen) Ing. Jakub Müller (člen) doc. Ing. Jiří Hošek, Ph.D. (člen)cs
but.defenceŽádné dodatečné otázky.cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSysel, Petrcs
dc.contributor.authorVystavěl, Kamilcs
dc.contributor.refereeMíča, Ivancs
dc.date.created2010cs
dc.description.abstractBakalářská práce se zabývá implementací metody rozpoznávání řeči s omezeným počtem rozpoznávaných slov v prostředí Matlab. Rozpoznávač je založen na metodě dynamického programování realizované algoritmem borcení časové osy (DTW) a je určen pro rozpoznávání izolovaných slov. Z řečového signálu jsou vyčíslovány příznaky pomocí metod krátkodobé analýzy signálu v časové a kmitočtové oblasti, dále pomocí metod na principu kepstrální analýzy a lineární prediktivní analýzy signálu. Příznaky vytvoří obraz slova vhodný pro kvantifikaci míry podobnosti s obrazem jiného slova. Algoritmus borcení časové osy eliminuje vliv kolísání tempa promluvy nelineární normalizací časové osy jednoho ze slov tak, aby se obrazy slov co nejvíce shodovaly. Míra podobnosti dvou slov je vyčíslena jako vzdálenost slov. Ve slovníku rozpoznávače jsou uloženy obrazy známých slov, obraz neznámého slova je porovnán s obrazy slov ve slovníku a jsou vyčísleny vzdálenosti každého známého slova s neznámým slovem. Neznámé slovo je určeno jako shodné s tím slovem ve slovníku, ke kterému má nejmenší vzdálenost. Úspěšnost klasifikace je závislá především na volbě příznaků.cs
dc.description.abstractThis bachelor thesis deals with the implementation of voice diagnostic method with limited number of recognized words in Matlab environment. Recognizer is designed for recognition of isolated words and is based on the dynamic programming method. This method is realized by the dynamic time warping algorithm (DTW). Features of the speech signal are calculated by methods of short-term analysis in time and frequency domain and by methods that are based on cepstral analysis and linear predictive analysis. The representation of the word, which is generated from its features, is suitable for quantifying the degree of similarity with the representation of another word. In order to achieve the highest degree of similarity, the dynamic time warping algorithm eliminates influence of fluctuation of the speech rate by non-linear normalization time axis of one of the compared words. The degree of the similarity of the two compared words is enumerated as the words’ distance. The representations of known words are stored in a word-book. The unknown word is compared with all words in the word-book and recognizer calculates distances between every known word and the unknown word. The unknown word is defined as identical with the known word that has the shortest distance to the unknown word. The successfulness depends mainly on the choice of the features.en
dc.description.markAcs
dc.identifier.citationVYSTAVĚL, K. Rozpoznávač řeči s omezeným slovníkem [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2010.cs
dc.identifier.other32275cs
dc.identifier.urihttp://hdl.handle.net/11012/5881
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání řečics
dc.subjectborcení časové osycs
dc.subjectDTWcs
dc.subjectvzdálenost slovcs
dc.subjectanalýza řečového signálucs
dc.subjectkepstrální analýzacs
dc.subjectlineární prediktivní analýza.cs
dc.subjectvoice recognitionen
dc.subjectdynamic time warpingen
dc.subjectDTWen
dc.subjectwords’ distanceen
dc.subjectspeech signal analysisen
dc.subjectcepstral analysisen
dc.subjectlinear predictive analysis.en
dc.titleRozpoznávač řeči s omezeným slovníkemcs
dc.title.alternativeVery limited Vocabulary Speech Recognizeren
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2010-06-15cs
dcterms.modified2010-07-13-11:45:24cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid32275en
sync.item.dbtypeZPen
sync.item.insts2025.03.16 13:16:18en
sync.item.modts2025.01.17 13:35:25en
thesis.disciplineTeleinformatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.58 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
1.42 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_32275.html
Size:
5.98 KB
Format:
Hypertext Markup Language
Description:
file review_32275.html
Collections