Zvyšování účinnosti strojového rozpoznávání řeči

but.committeeprof. Ing. Stanislav Hanus, CSc. (předseda) Prof. Ing. Jana Tučková, CSc. - oponentka (člen) Prof. Ing. Jan Nouza, CSc. - oponent (člen) prof. Ing. Roman Maršálek, Ph.D. (člen) prof. Ing. Aleš Prokeš, Ph.D. (člen) Doc. Ing. Pavol Galajda, Ph.D. (člen) Ing. Jan Šimša, CSc. (člen)cs
but.jazykčeština (Czech)
but.programElektrotechnika a komunikační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSigmund, Milancs
dc.contributor.authorZelinka, Petrcs
dc.contributor.refereeTučková,, Janacs
dc.contributor.refereeNouza,, Jancs
dc.date.created2012cs
dc.description.abstractV práci jsou identifikovány příčiny nedostatečné spolehlivosti současných systémů pro automatické rozpoznávání řeči při jejich nasazení v náročných podmínkách. U jednotlivých rušivých vlivů je popsán jejich dopad na úspěšnost rozpoznávání a je podán výčet známých postupů pro identifikaci těchto vlivů analýzou rozpoznávaného signálu. Je též uveden přehled obvyklých metod používaných k omezení dopadu rušivých vlivů na funkci rozpoznávače řeči. Vlastní přínos tkví v navržení nových postupů pro vytváření akustických modelů zašuměné řeči a modelů nestacionárního šumu, díky kterým je možné dosáhnout vysoké úspěšnosti rozpoznávání v náročných akustických podmínkách. Účinnost navržených opatření byla otestována na rozpoznávači izolovaných slov s využitím nahrávky reálného akustického pozadí operačního sálu pořízené na Uniklinikum Marburg v Německu při několikahodinové neurochirurgické operaci. Tato práce jako první přináší popis dopadu změn v hlasovém úsilí mluvčích na spolehlivost rozpoznávání řeči v celém rozsahu, tj. od šepotu až po křik. Je navržena koncepce rozpoznávače řeči, který je imunní vůči změnám v hlasovém úsilí mluvčích. Pro účely zkoumání změn v hlasovém úsilí byla v rámci řešení práce sestavena nová řečová databáze BUT-VE1.cs
dc.description.abstractThis work identifies the causes for unsatisfactory reliability of contemporary systems for automatic speech recognition when deployed in demanding conditions. The impact of the individual sources of performance degradation is documented and a list of known methods for their identification from the recognized signal is given. An overview of the usual methods to suppress the impact of the disruptive influences on the performance of speech recognition is provided. The essential contribution of the work is the formulation of new approaches to constructing acoustical models of noisy speech and nonstationary noise allowing high recognition performance in challenging conditions. The viability of the proposed methods is verified on an isolated-word speech recognizer utilizing several-hour-long recording of the real operating room background acoustical noise recorded at the Uniklinikum Marburg in Germany. This work is the first to identify the impact of changes in speaker’s vocal effort on the reliability of automatic speech recognition in the full vocal effort range (i.e. whispering through shouting). A new concept of a speech recognizer immune to the changes in vocal effort is proposed. For the purposes of research on changes in vocal effort, a new speech database, BUT-VE1, was created.en
dc.description.markPcs
dc.identifier.citationZELINKA, P. Zvyšování účinnosti strojového rozpoznávání řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.cs
dc.identifier.other42198cs
dc.identifier.urihttp://hdl.handle.net/11012/7698
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectStrojové rozpoznávání řečics
dc.subjectskryté Markovovy modelycs
dc.subjectnestacionární šumcs
dc.subjecthlasové úsilícs
dc.subjectvariabilita řečics
dc.subjectAutomatic speech recognitionen
dc.subjecthidden Markov modelsen
dc.subjectnonstationary noiseen
dc.subjectvocal efforten
dc.subjectspeech variabilityen
dc.titleZvyšování účinnosti strojového rozpoznávání řečics
dc.title.alternativeEnhancing the effectiveness of automatic speech recognitionen
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.dateAccepted2012-03-29cs
dcterms.modified2024-05-17-12:54:21cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid42198en
sync.item.dbtypeZPen
sync.item.insts2025.03.27 11:54:55en
sync.item.modts2025.01.15 19:45:33en
thesis.disciplineElektronika a sdělovací technikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav radioelektronikycs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 5
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.76 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
thesis-1.pdf
Size:
520 KB
Format:
Adobe Portable Document Format
Description:
thesis-1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-VUT_PhD_Zelinka.pdf
Size:
134.42 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-VUT_PhD_Zelinka.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-Nouza_DizertaceZelinkaposudek.pdf
Size:
79.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-Nouza_DizertaceZelinkaposudek.pdf
Loading...
Thumbnail Image
Name:
review_42198.html
Size:
4.55 KB
Format:
Hypertext Markup Language
Description:
file review_42198.html
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections