Restaurace poškozených audio signálů založená na optimalizaci s neuronovými sítěmi

Loading...
Thumbnail Image

Date

Authors

Čermák, Václav

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato práce se zabývá doplňováním souvislých chybějících úseků ve zvukových signálech. Dává přehled dosavadních řešení problematiky, přičemž se zaměřuje na přístupy využívající optimalizaci. V jejím rámci byla navržena a implementována metoda založená na principu consensus equilibrium dále označovaná jako metoda CE nebo pouze ekvilibrium, která kombinuje různé existující metody jako tzv. agenty s cílem nalézt společné kompromisní řešení, ke kterému všichni tito agenti směřují. Kvalita rekonstrukce metody CE byla porovnána s jejími jednotlivými komponentami, které se skládaly z metod využívajících spektrální řídkosti, autoregrese a hlubokého učení. Jednotlivé výstupy byly porovnány pomocí objektivních metrik a hodnocen byl i vliv parametrů ekvilibria na výslednou kvalitu rekonstrukce. V řadě případů metoda CE překonala své jednotlivé agenty a to především v momentech, kdy všichni dospěli k dobrému řešení. Pokud řešení některého z agentů nebylo kvalitní z hlediska objektivních metrik, dokázalo jej ekvilibrium potlačit pokud ostatní agenti byli sami schopni řešení nalézt. Pokud většina agentů nebyla schopná ke kvalitnímu řešení dospět, pak i metoda CE vygenerovala horší výsledek, který většinou překonal některý z jejích agentů.
This thesis deals with inpainting of continuous missing segments in audio signals. It gives an overview of previous solutions to the problem, focusing on approaches using optimization. It proposes and implements a method based on the consensus equilibrium principle, hereafter referred to as the CE method, which combines various existing methods as so-called agents in order to find a common compromise solution towards which all these agents work. The reconstruction quality of the CE method was compared with its individual components, which consisted of methods based on spectral sparsity, autoregression and deep learning. The individual outputs were compared using objective metrics, and the influence of the equilibrium parameters on the resulting reconstruction quality was assessed. In a many cases, the CE method outperformed its individual agents and especially in moments when all generated a good solution. If any agent's solution was not of good quality in terms of objective metrics, the equilibrium was able to overcome it as long as the other agents were able to find a solution themselves. If most of the agents were unable to come to a good solution, then also the CE method generated a worse result, which was usually outperformed by one of its agents.

Description

Citation

ČERMÁK, V. Restaurace poškozených audio signálů založená na optimalizaci s neuronovými sítěmi [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

prof. Mgr. Pavel Rajmic, Ph.D. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) Ing. Václav Vencovský, Ph.D. (člen) MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen) Ing. Václav Mach, Ph.D. (člen)

Date of acceptance

2025-06-12

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. otázky: Co by se stalo, kdyby v roli všech agentů vystupoval úplně identický algoritmus? Dávalo by v nějakém případě smysl váhy agentů (řecké mí) postupně měnit v průběhu iterací? Vysvětlete, jak chápete slova polyfonní, monofonní, stereofonní a vztahy mezi nimi (str. 23). Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO