Bezeztrátové kódování řeči z mikrofonního pole

Loading...
Thumbnail Image

Date

Authors

Myška, David

Mark

E

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato bakalářská práce se zabývá bezeztrátovým kódování řečových signálů z mikrofonních polích. Uvádí popis metod použitých v referenčním kodeku FLAC a jejich obměny pro zvýšení komprese pro signály z mikrofonních polí. Dále uvádí popis metod pro zarovnání kanálů pro jejich následné zpracování. Na konci práce jsou zhodnoceny dosažené výsledky v porovnání s referenčním kodekem FLAC.
This bachelor's thesis deals with lossless coding of speech signals from microphone arrays. It describes the methods used in the FLAC reference codec and their variations to increase compression for signals from microphone arrays. The following describes methods for aligning channels for their subsequent processing. At the end of the work the results obtained are compared with the reference codec FLAC.

Description

Citation

MYŠKA, D. Bezeztrátové kódování řeči z mikrofonního pole [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)

Date of acceptance

2019-06-14

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: vypočítejte maximální povolené zpoždění pro mikrofonní pole o velikosti 30cm, pro signál na 16 kHz přicházející na dva nejvzdálenější mikrofony zboku. Bude Vám stačit maximální povolený lag ve Vašem SW? vysvětlete důvod pro počítání rozdílů posunutých reziduálních signálů a ne originálních signálů.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO