Bezeztrátové kódování signálů z mikrofonního pole

Loading...
Thumbnail Image

Date

Authors

Kálazi, Adrián

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
Lossless audio coding is increasingly important for properly archiving and preserving audio in its original form. To achieve a good compression ratio, lossless encoding techniques such as linear prediction and Rice coding are often applied to the original audio in order to minimize its entropy and preserve the original signal bit-precisely with a reduced size. This thesis explores the possibilities of efficiently encoding multi-channel audio in a way that exploits the similarity between multiple channels in order to achieve better compression ratios. This thesis also explores the techniques employed by FLAC in more depth while also providing solutions to a few problems that FLAC fails to address.

Description

Citation

KÁLAZI, A. Bezeztrátové kódování signálů z mikrofonního pole [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Informační technologie

Comittee

prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)

Date of acceptance

2022-06-15

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: What happens to the passive down-mix (d_MID in eq. 4.9) if the two input channels, s_L and s_R, have opposite phase, i.e. effectively cancelling each other? How do you deal with this problem in your codec? In Fig. 4.14 the "m" parameter seems toggling. Would smoothing or interpolation help? On page 23 you state that the entropy rises when the input signals are re-scaled to the same energy level. Can you explain how is it possible? I'd expect the exact opposite, i.e. lower energy of the residual signal and, consequently, also lower entropy.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO