Robustní detekce řečové aktivity

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) doc. Ing. Oldřich Trenz, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře. Otázky u obhajoby: Narazila jste při studiu literatury na analýzu toho jaký vliv má detekce řečové aktivity na úspěšnost cílové aplikace? Dokázala byste kvantifikovat, jaké zlepšení pči detekci řeči už vede k signifikantnímu zlepšení cílové aplikace?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMatějka, Pavelcs
dc.contributor.authorPopková, Annacs
dc.contributor.refereePlchot, Oldřichcs
dc.date.accessioned2019-07-08T15:57:00Z
dc.date.available2019-07-08T15:57:00Z
dc.date.created2019cs
dc.description.abstractCílem této práce je navrhnout a vytvořit robustní detektor řečové aktivity, který je schopen detekovat řeč v různých jazycích, v prostředí se šumem a v prostředí s hudbou na pozadí. Tento problém jsem se rozhodla vyřešit použitím neuronové sítě jako klasifikačního modelu, který vstupním úsekům nahrávky přiřazuje jednu ze čtyř možných tříd - ticho, řeč, hudbu nebo hluk. Výsledný nástroj je schopný detekovat řeč v minimálně 12-ti jazycích. Řeč na hudebním pozadí až s 88 % úspěšností a výsledky úspěšnosti systému na zašuměných datech dosahují od 84 % (5 dB SNR) do 88 % (20 dB SNR). Tento nástroj je možné použít pro detekci řečové aktivity v různých výzkumných oblastech zpracování řeči. Hlavním jeho přínosem je eliminace hudby, která když odstraněna není, výrazně zvyšuje chybovost systémů na rozpoznávání mluvčího či řeči.cs
dc.description.abstractThe aim of this work is to design and create a robust speech activity detector that is able to detect speech in different languages, in a noise environment and with music on background. I decided to solve this problem by using a neural network as a classification model that assigns one of the four possible classes - silence, speech, music, or noise to the input of audio recording. The resulting tool is able to detect the speech in at least 12 languages. Speech with musical background up to 88 % accuracy and system success on noisy data reaches from 84 % (5 dB SNR) to 88 % (20 dB SNR). This tool can be used for speech activity detection in various research areas of speech processing. The main contribution is the elimination of music, which when not eliminated, significantly increases the error rate of systems for speaker identification or speech recognition.en
dc.description.markBcs
dc.identifier.citationPOPKOVÁ, A. Robustní detekce řečové aktivity [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122046cs
dc.identifier.urihttp://hdl.handle.net/11012/180389
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRobustní detekce řečové aktivitycs
dc.subjectHudbacs
dc.subjectŠumcs
dc.subjectNeuronová síťcs
dc.subjectSNR.cs
dc.subjectRobust voice activity detectionen
dc.subjectMusicen
dc.subjectNoiseen
dc.subjectNeural Networken
dc.subjectSNR.en
dc.titleRobustní detekce řečové aktivitycs
dc.title.alternativeRobust Speech Activity Detectionen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-14cs
dcterms.modified2019-07-08-13:31:25cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122046en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 00:10:48en
sync.item.modts2021.11.22 23:23:32en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.07 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21780_v.pdf
Size:
126.68 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21780_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21780_o.pdf
Size:
87.74 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21780_o.pdf
Loading...
Thumbnail Image
Name:
review_122046.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
review_122046.html
Collections