Potlačování šumu v řeči založené na waveletové transformaci a rozeznávání znělosti segmentů

Loading...
Thumbnail Image

Date

Authors

Chrápek, Tomáš

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Waveletová transformace je moderním nástrojem pro zpracování signálů a je hojně a s úspěchem využívána hlavně pro své unikátní vlastnosti, zejména schopnost zachytit rychlé změny ve zpracovávaném signálu. Práce pojednává obecně o waveletech, waveletové transformaci a jejím využití v aplikacích zabývajících se potlačováním šumu. Byl uveden hlavní problém spojený s potlačováním šumu v řečovém signálu, a to degradace neznělých částí spojená s potlačováním šumu. Neznělé části jsou při aplikaci standardního algoritmu na waveletové potlačení šumu potlačeny spolu s šumem. Řešením je rozdílný přístup ke znělým a neznělým segmentům řečového signálu. Cílem diplomové práce bylo vytvořit aplikaci, jež bude implementovat waveletové potlačování aditivního gaussovského šumu v řečových signálech s obecně rozdílným přístupem ke znělým a neznělým segmentům. Tato aplikace je naprogramována jako grafické uživatelské rozhraní (GUI) ve vývojovém prostředí MATLAB a umožňuje pohodlně testovat procedury představené v diplomové práci. Práce dále prezentuje dosažené výsledky a diskutuje jejich úspěšnost vzhledem k požadavkům na aplikaci tohoto typu kladených. Nejpodstatnějším závěrem této diplomové práce je potom fakt, že při potlačování šumu v neznělých segmentech řečového signálu musíme volit kompromis mezi dostatečným potlačením šumu a zachováním srozumitelnosti řeči.
The wavelet transform is a modern signal processing tool. The wavelet transform earned itself a great success mainly for its unique properties, such as the capability of recognizing very fast changes in processed signal. The theoretical part of this work is introduction to wavelet theory, more specifically wavelet types, a wavelet transform and its application in systems dealing with signal denoising. A main problem connected to speech signals denoising was introduced. The problem is degradation of the speech signal when denoising unvoiced parts. It is because of the fact that unvoiced parts and noise itself have very similar characteristics. The solution would be to apply different attitude to voiced and unvoiced segments of the speech. The main goal of this diploma thesis was to create an application implementing the speech signal denoising using the wavelet transform. The special attention should have been paid to applying different attitude to voiced and unvoiced segments of the speech. The demanded application is programmed as a grafical user interface (GUI) in MATLAB environment. The algorithm implemented in this form allows users to test introduced procedures with a great comfort. This work presents achieved results and discusses them considering general requirements posed on an application of given type. The most important conlusion of this Diploma Thesis is the fact that some kind of trade-off between sufficient signal denoising and keeping the speech understandable has to be made.

Description

Citation

CHRÁPEK, T. Potlačování šumu v řeči založené na waveletové transformaci a rozeznávání znělosti segmentů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Telekomunikační a informační technika

Comittee

doc. Ing. Ivan Rampl, CSc. (předseda) doc. Ing. Martin Medvecký, Ph.D. (místopředseda) Ing. Ladislav Káňa (člen) Ing. Ivo Herman, CSc. (člen) prof. Mgr. Pavel Rajmic, Ph.D. (člen) Ing. Tomáš Vaněk, Ph.D. (člen) doc. Ing. David Kubánek, Ph.D. (člen) Ing. Václav Pfeifer, Ph.D. (člen) doc. Ing. Milan Chmelař, CSc. (člen)

Date of acceptance

2008-06-11

Defence

1. Jak by se změnil vztah (1.11) pro dyadickou diskrétní waveletovou transformaci? 2. Byla hodnota prahu stanovena individuálně pro každou úroveň rozkladu nebo stanovena pro všechny stejně? Mělo by to nějaký vliv a jak by se toho dalo případně využít? 3. Proč je hodnota zvoleného koeficientu 'k' v rovnici (4.1) dělena dvěma? Proč je rozsah koeficientu zvolen od 0 do 1, když hodnoty větší než 0,8 již nemají na znělé segmenty vliv?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO