Vícekanálové metody zvýrazňování řeči
but.committee | Ing. Robert Vích, DrSc. (předseda) prof. Ing. Zdeněk Smékal, CSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Karel Kopecký (člen) Ing. Michal Soumar (člen) Ing. Milan Šimek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Jan Vlach, Ph.D. (člen) | cs |
but.defence | Otázky oponenta 1. Na předloženém CD jsou zvukové ukázky pouze v anglickém jazyce a to pouze ke kapitolám 5 a 7. Proč jsou ukázky převzaty? Proč nedošlo k testování s vlastními zvukovými ukázkami v českém jazyce? Proč není uvedena zvuková ukázka pro algoritmus rostoucího gradientu? 2. Vzorec (7.1) a (7.3) popisuje operaci konvoluce. Jaké typy konvoluce znáte a o jaký druh konvoluce se v tomto případě jedná. Za jakých podmínek můžete považovat vzorec (7.2) a (7.4) za ekvivalentní a jak to souvisí s různými druhy konvoluce? | cs |
but.jazyk | čeština (Czech) | |
but.program | Elektrotechnika, elektronika, komunikační a řídicí technika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smékal, Zdeněk | cs |
dc.contributor.author | Zitka, Adam | cs |
dc.contributor.referee | Balík, Miroslav | cs |
dc.date.accessioned | 2019-05-17T02:22:18Z | |
dc.date.available | 2019-05-17T02:22:18Z | |
dc.date.created | 2008 | cs |
dc.description.abstract | Diplomová práce se zabývá vícekanálovými metodami zvýrazňování řeči. Vícekanálové metody zvýrazňování řeči používají pro snímání signálů více mikrofonů. Ze směsí signálů můžeme pomocí neuronových sítí oddělit například jednotlivé mluvčí, potlačit hluk v pozadí či šum. Tato úloha bývá nazývána cocktail-party efekt. Hlavní metoda řešící tento problém se nazývá analýza nezávislých komponent. V práci jsou nejdříve popsány její teoretické základy a jsou představeny podmínky a požadavky k její aplikaci. Jednotlivé metody ICA se snaží směsi rozdělovat pomocí hledání co nejmenších gaussovských vlastností signálů. Pro analýzu nezávislých komponent se používají různé matematické vlastnosti signálů jako je např. špičatost a entropie. Signály, které byly smíšeny uměle v počítači, lze poměrně dobře oddělovat např. pomocí FastICA či algoritmu rostoucího gradientu. Složitější situace nastává, chceme-li oddělit signály pořízené v reálném nahrávacím prostředí, protože separaci řeči osob současně mluvících v reálném prostředí ovlivňují různé další okolnosti jako akustické vlastnosti místnosti, šum, zpoždění, odrazy od stěn, pozice či typ mikrofonů apod. Práce představuje postup analýzy nezávislých komponent ve frekvenční oblasti, který dokáže úspěšně oddělit i nahrávky pořízené v reálném prostředí. | cs |
dc.description.abstract | This thesis deals with multi-channel methods of speech enhancement. Multichannel methods of speech enhancement use a few microphones for recording signals. From mixtures of signals, for example, individual speakers can be separated, noise should be reduced etc. with using neural networks. The task of separating speakers is known as a cocktail-party effect. The main method of solving this problem is called independent component analysis. At first there are described its theoretical foundation and presented conditions and requirements for its application. Methods of ICA try to separate the mixtures with help of searching the minimal gaussian properties of signals. For the analysis of independent components are used different mathematical properties of signals such as kurtosis and entropy. Signals, which were mixed artificially on a computer, can be relatively well separated using, for example, FastICA algorithm or ICA gradient ascent. However, difficult is situation, if we want to separate the signals created in the real recording enviroment, because the separation of speech people speaking at the same time in the real environment affects other various factors such as acoustic properties of the room, noise, delays, reflections from the walls, the position or the type of microphones, etc. Work presents aproach of independent component analysis in the frequency domain, which can successfully separate also recordings made in the real environment. | en |
dc.description.mark | A | cs |
dc.identifier.citation | ZITKA, A. Vícekanálové metody zvýrazňování řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008. | cs |
dc.identifier.other | 14312 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/18881 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | analýza nezávislých komponent | cs |
dc.subject | ICA | cs |
dc.subject | slepá separace zdrojů | cs |
dc.subject | cocktail-party efekt | cs |
dc.subject | zvýrazňování řeči | cs |
dc.subject | independent component analysis | en |
dc.subject | ICA | en |
dc.subject | blind source separation | en |
dc.subject | cocktail-party effect | en |
dc.subject | speech enhancement | en |
dc.title | Vícekanálové metody zvýrazňování řeči | cs |
dc.title.alternative | Multi-channel Methods of Speech Enhancement | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2008-06-11 | cs |
dcterms.modified | 2008-06-11-17:03:38 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 14312 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.12 20:09:51 | en |
sync.item.modts | 2021.11.12 19:46:21 | en |
thesis.discipline | Telekomunikační a informační technika | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |