Lineární predikční a kepstrální syntéza řečového signálu v systému TTS

Loading...
Thumbnail Image

Date

Authors

Mekyska, Jiří

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Práce se zabývá lineární predikční a kepstrální syntézou řečového signálu v systémech TTS (Text-to-Speech) s možností modelování prozodie. Je zde uveden popis řečového signálu v akustické a fonetické rovině, princip tvorby řeči a způsob znázornění řečového signálu v časové a kmitočtové oblasti. Dále je zde uvedena bloková stavba TTS systémů, přičemž každý blok je zvlášť detailně popsán. V práci je také popsána problematika modelování prozodie pomocí tří nejdůležitějších suprasegmentálních rysů (základní tón, trvání a intenzita řeči). Na konci je proveden návrh a realizace univerzálního českého TTS systému, který je založen na syntéze řeči v kmitočtové oblasti. Tento systém je implementován v programu MATLAB.
This work deals with a linear prediction and cepstral synthesis of speech signal in the TTS (Text-to-Speech) systems with the opportunity of modeling the prosody. The work contains a description of speech signal in acoustic and phonetic plane, the principle of speech production and the way we can figure the speech signal in time and frequency domain. Next, there is the TTS block structure mentioned, whereas each block has its own detailed description. In the work, the modeling of prosody using the three most important suprasegmental features (fundamental tone, continuation and speech intensity) is also described. At the end of this work, there is a design and realization of universal Czech TTS system which is based on the speech synthesis in frequency domain. This system is implemented in program MATLAB.

Description

Citation

MEKYSKA, J. Lineární predikční a kepstrální syntéza řečového signálu v systému TTS [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Teleinformatika

Comittee

prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Martin Vondra, Ph.D. (místopředseda) Ing. Jan Vlach, Ph.D. (člen) Ing. Martin Plšek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Milan Šimek, Ph.D. (člen)

Date of acceptance

2008-06-17

Defence

1. Z jakého důvodu vzniká bzučení při buzení znělých hlásek sledem impulzů? 2. Vysvětlete pojem "okluzivní pauza " (str.21)?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO