Identifikace pauz v rušeném řečovém signálu

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato diplomová práce se zabývá identifikací pauz v rušeném řečovém signálu. Je zde popsán charakter řečového signálu a koncepce jeho zpracování. Cílem diplomové práce bylo navrhnout metodu spolehlivého určení úseků bez řečové aktivity (pauz) jak pro řeč bez přítomnosti šumu a rušení, tak i ze směsi řeči a nežádoucího rušení. Pro identifikaci pauz bylo realizováno pět detektorů v programovém prostředí MATLAB. V časové oblasti to byl energetický detektor, ve spektrální oblasti dvoukrokový detektor využívající v prvním kroku energetické vlastnosti signálu, ve druhém výpočtu statistických veličin. V kepstrální oblasti byly realizovány tři detektory, dva s využitím integrálního algoritmu a detekce třetího byla založena na diferenciálním algoritmu. Robustnost detektorů byla testována pro různé typy rušení a jejich úrovně odstupu signálu od šumu (Signal to Noise Ratio – SNR). Pro vyhodnocení úspěšnosti detekce byly sestaveny ROC křivky, ve kterých byl měnícím se parametrem rušivý signál.
This diploma thesis deals with pause identification with degraded speech signal. The speech characteristics and the conception of speech signal processing are described here. The work aim was to create the reliable recognizing method to establish speech and non-speech segments of speech signal with and without degraded speech signal. The five empty pause detectors were realized in computing environment MATLAB. There was the energetic detector in time domain, two-step detector in spectral domain, one-step integral detector, two-step integral detector and differential detector in cepstrum. The spectral detector makes use of energetic characteristics of speech signal in first step and statistic analysis in second step. Cepstral detectors make use of integral or differential algorithms. The detectors robustness was tested for different types of speech degradation and different values of Signal to Noise Ratio. The test of influence different speech degradation was conducted to compare non-speech detection for detectors by ROC (Receiver Operating Characteristic) Curves.
Description
Citation
PODLOUCKÁ, L. Identifikace pauz v rušeném řečovém signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Telekomunikační a informační technika
Comittee
Ing. Robert Vích, DrSc. (předseda) prof. Ing. Zdeněk Smékal, CSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Karel Kopecký (člen) Ing. Michal Soumar (člen) Ing. Milan Šimek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Jan Vlach, Ph.D. (člen)
Date of acceptance
2008-06-11
Defence
Otázky oponenta: V práci popisujete výhodu Hammingova okna vůči obdélníkovému oknu při jeho použití během segmentace jako, cituji … "potlačuje vzorky na kraji segmentu, čimž se zvyšuje stabilita některých výpočtu". Jakým způsobem je definován vliv váhovacího okna na kmitočtové spektrum signálu po jeho segmentaci? Který z uvedených detektorů je nejvýhodnější pro detekci pauz v řečovém signálu při uvažování minimálního rušení a při uvažování vyšší úrovně reálného rušení?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO