Far-Field Speech Recognition

but.committeeprof. Ing. Tomáš Vojnar, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) prof. RNDr. Milan Češka, CSc. (člen) Ing. Martin Hrubý, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. Oldřich Trenz, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: 1) Why is there such a bug difference when the background noise and reverberation are created "artificially" compared to real recordings? 2) The MVDR condition v_sd[h_n0] = 0 is very strong. Would it help if the speech distortion was only minimized instead of removed completely? 3) What is the largest delay (angle) that MVDR can efficiently deal with? 4) How did you select the best channel of your reference (single-channel) system? 5) Would it improve the overall efficiency if unvoiced frames were also excluded from the input signal? 6) What is the objective function of the weights-estimating DNN?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorŽmolíková, Kateřinaen
dc.contributor.refereeMalenovský, Vladimíren
dc.date.accessioned2019-04-04T04:12:59Z
dc.date.available2019-04-04T04:12:59Z
dc.date.created2016cs
dc.description.abstractSystémy rozpoznávání řeči v dnešní době dosahují poměrně vysoké úspěšnosti. V případě řeči, která je snímána vzdáleným mikrofonem a je tak narušena množstvím šumu a dozvukem (reverberací), je ale přesnost rozpoznávání značně zhoršena. Tento problém je možné zmírnit využitím mikrofonních polí. Tato práce se zabývá technikami, které umožňují kombinovat signály z více mikrofonů tak, aby byla zlepšena kvalita výsledného signálu a tedy i přesnost rozpoznávání. Práce nejprve shrnuje teorii rozpoznávání řeči a uvádí nejpoužívanější algoritmy pro zpracování mikrofonních polí. Následně jsou demonstrovány a analyzovány výsledky použití dvou metod pro beamforming a metody dereverberace vícekanálových signálů. Na závěr je vyzkoušen alternativní způsob beamformingu za použití neuronových sítí.en
dc.description.abstractThe accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks.cs
dc.description.markAcs
dc.identifier.citationŽMOLÍKOVÁ, K. Far-Field Speech Recognition [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96580cs
dc.identifier.urihttp://hdl.handle.net/11012/61823
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání řečien
dc.subjectmikrofonní poleen
dc.subjectbeamformingen
dc.subjectdereverberaceen
dc.subjectspeech recognitioncs
dc.subjectmicrophone arrayscs
dc.subjectbeamformingcs
dc.subjectdereverberationcs
dc.titleFar-Field Speech Recognitionen
dc.title.alternativeFar-Field Speech Recognitioncs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-22cs
dcterms.modified2020-05-10-16:12:43cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96580en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 00:10:06en
sync.item.modts2021.11.22 23:39:29en
thesis.disciplineMatematické metody v informačních technologiíchcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.38 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18867_v.pdf
Size:
86.63 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18867_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18867_o.pdf
Size:
86.73 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18867_o.pdf
Loading...
Thumbnail Image
Name:
review_96580.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_96580.html
Collections