Detekce klíčových slov v řečových signálech

Loading...
Thumbnail Image
Date
Authors
Pfeifer, Václav
ORCID
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Systémy pro zpracování řečových signálů jsou vyvíjeny již delší dobu, ale až s nástupem výkonných výpočetních systémů se začalo s integrací těchto systémů do praxe. Tato disertační práce se zabývá návrhem systému pro detekci klíčových slov v řečových signálech. Navržený systém principiálně vychází z Large Margin and Kernel metod a klíčovou součástí systému je fonémový klasifikátor. Byly navrženy dva hierarchické klasifikátory – lineární a nelineární, spolu s efektivním trénovacím algoritmem. Současně byl navržen klasifikátor založený na „Gaussian Mixture Models“ s implementací hierarchické struktury. Důležitou součástí detekčního systému je extrakce příznaků, a proto byl navržený systém vyhodnocen na současně nejrozšířenějších extrakčních metodách. Součástí technického řešení práce byla implementace detekčního systému v prostředí MATLABU a návrh hierarchické fonémové struktury pro Český jazyk. Všechny algoritmy byly vyhodnoceny pro Český a Anglický jazyk na databázích (DBRS a TIMIT)
Speech processing systems have been developed for many years but the integration into devices had started with the deployment of the modern powerful computational systems. This dissertation thesis deals with development of the keyword detection system in speech data. The proposed detection system is based on the Large Margin and Kernel methods and the key part of the system is phoneme classifier. Two hierarchical frame-based classifiers have been proposed -- linear and non-linear. An efficient training algorithm for each of the proposed classifier have been introduced. Simultaneously, classifier based on the Gaussian Mixture Models with the implementation of the hierarchical structure have been proposed. An important part of the detection system is feature extraction and therefor all algorithms were evaluated on the current most common feature techniques. A part of the thesis technical solution was implementation of the keyword detection system in MATLAB and design of the hierarchical phoneme structure for Czech language. All of the proposed algorithms were evaluated for Czech and English language over the DBRS and TIMIT speech corpus.
Description
Citation
PFEIFER, V. Detekce klíčových slov v řečových signálech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Teleinformatika
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) prof. Ing. Kamil Vrba, CSc. (člen) doc. Ing. Jiří Schimmel, Ph.D. (člen) Doc. Ing. Otto Dostál, CSc. - oponent (člen) doc. Ing. Petr Sysel, Ph.D. (člen) Ing. Jiří Krejčí, Ph.D. (člen) Prof. Ing. Florián Makáň, Ph.D. - oponent (člen)
Date of acceptance
2013-07-16
Defence
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO