Odhad impulsní odezvy místnosti z řečového signálu
but.committee | prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Proč jste v rovnicích 3.10 a 3.14 zvolil zrovna průměr? Nebyla by průměrná odchylka či rozptyl vhodnější? Ukažte příklady slov obsahující foném T. Proč jste vybral zrovna tato slova? Můžete jasně definovat jaký byl váš baseline? Můžete porovnat množství trénovacích dat s velikostí modelu? Co počítaly rovnice 3.10 a 3.14? Jaké místnosti obsahoval dataset? Jsou z hlediska impulzní odezvy lepší menší nebo větší místnosti? | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Černocký, Jan | en |
dc.contributor.author | Gregor, Adam | en |
dc.contributor.referee | Szőke, Igor | en |
dc.date.created | 2020 | cs |
dc.description.abstract | Jakýkoliv zvuk šířící se místností je zkreslen impulsní odezvou této místnosti. Měření těchto impulsních odezev bylo vždy důležitou úlohou akustiky, která v dnešní době ještě nabyla na důležitosti, díky možnosti požití impulsních odezev při augmentaci dat pro účely trénování automatických rozpoznávačů řeči. Standardně je impulsní odezva místnosti měřena za pomoci čisté a zkreslené formy zvukového signálu. To je však v praxi nepraktické (například u domácích asistentů či chytrých domů), neboť zde je k dispozici jen zkreslený signál. Tato bakalářská práce se zabývá odhadem impulsní odezvy "naslepo, pouze pomocí zkresleného řečového signálu. Nejdříve jsme za použití datasetu BUT ReverbDB re-implementovali standardní techniky pro měření impulsní odezvy z čistého/zkresleného signálu. Poté jsme testovali dvě techniky odhadující impulsní odezvu místnosti pouze ze zkreslené řeči. První technika k tomu používá impulsní fonémy ve zkreslené řeči, u kterých se předpokládá, že se podobají impulsním odezvám místností. Bylo testováno průměrování a dekonvoluce těchto fonémů za účelem zvýšení kvality a robustnosti odhadu. Druhá technika využívá regresní neuronové sítě generující impulsní odezvy místností z řeči na vstupu. Ačkoliv žádná z navrhovaných technik nedosahuje odhadů na úrovni standardních měření, mají tyto odhady potenciál při augmentaci dat pro trénování automatických rozpoznávačů řeči. | en |
dc.description.abstract | When travelling in a room, any sound is distorted by a room impulse response (RIR). Determining RIR has always been an important task in acoustics, but nowadays, it is even more important, as RIR can be used to augment data for training automatic speech recognition (ASR) systems. Classically, a RIR is estimated from a pair of clean and reverberated sound signals. This is however not practical for real scenarios (such as personal assistants, smart homes, etc.), as the clean signal is not available. The aim of the bachelor thesis is to investigate ''blind'' RIR estimation only from a reverberated speech signal. We have used the BUT ReverbDB data set and first, re-implemented techniques for classical clean-reverberated signals estimation of RIRs. Then, we investigated two techniques for RIR estimation only from a reverberated signal. The first technique uses reverberated impulse-like phonemes in speech which are expected to resemble RIR. Averaging and deconvolution of these phonemes were tested to improve the quality and robustness of the estimation. The second technique makes use of a regression neural networks trained to produce the RIR from a speech input. Although none of the techniques reaches the quality of classical measurement, the estimated RIRs have the potential to help in augmenting data for ASR system training. | cs |
dc.description.mark | B | cs |
dc.identifier.citation | GREGOR, A. Odhad impulsní odezvy místnosti z řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020. | cs |
dc.identifier.other | 129132 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/191492 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Odhad Impulsní odezvy místnosti | en |
dc.subject | Řečový signál | en |
dc.subject | Room Impulse Response Estimation | cs |
dc.subject | Speech signal | cs |
dc.title | Odhad impulsní odezvy místnosti z řečového signálu | en |
dc.title.alternative | Room Impulse Response Estimation from Speech Signal | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2020-07-10 | cs |
dcterms.modified | 2020-07-13-23:41:08 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 129132 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:29:40 | en |
sync.item.modts | 2025.01.15 12:50:40 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 3.74 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-21947_v.pdf
- Size:
- 85.89 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-21947_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-21947_o.pdf
- Size:
- 89.04 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-21947_o.pdf
Loading...
- Name:
- review_129132.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_129132.html