Vícekanálové metody zvýrazňování řeči

but.committeeIng. Robert Vích, DrSc. (předseda) prof. Ing. Zdeněk Smékal, CSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Karel Kopecký (člen) Ing. Michal Soumar (člen) Ing. Milan Šimek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Jan Vlach, Ph.D. (člen)cs
but.defenceOtázky oponenta 1. Na předloženém CD jsou zvukové ukázky pouze v anglickém jazyce a to pouze ke kapitolám 5 a 7. Proč jsou ukázky převzaty? Proč nedošlo k testování s vlastními zvukovými ukázkami v českém jazyce? Proč není uvedena zvuková ukázka pro algoritmus rostoucího gradientu? 2. Vzorec (7.1) a (7.3) popisuje operaci konvoluce. Jaké typy konvoluce znáte a o jaký druh konvoluce se v tomto případě jedná. Za jakých podmínek můžete považovat vzorec (7.2) a (7.4) za ekvivalentní a jak to souvisí s různými druhy konvoluce?cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmékal, Zdeněkcs
dc.contributor.authorZitka, Adamcs
dc.contributor.refereeBalík, Miroslavcs
dc.date.accessioned2019-05-17T02:22:18Z
dc.date.available2019-05-17T02:22:18Z
dc.date.created2008cs
dc.description.abstractDiplomová práce se zabývá vícekanálovými metodami zvýrazňování řeči. Vícekanálové metody zvýrazňování řeči používají pro snímání signálů více mikrofonů. Ze směsí signálů můžeme pomocí neuronových sítí oddělit například jednotlivé mluvčí, potlačit hluk v pozadí či šum. Tato úloha bývá nazývána cocktail-party efekt. Hlavní metoda řešící tento problém se nazývá analýza nezávislých komponent. V práci jsou nejdříve popsány její teoretické základy a jsou představeny podmínky a požadavky k její aplikaci. Jednotlivé metody ICA se snaží směsi rozdělovat pomocí hledání co nejmenších gaussovských vlastností signálů. Pro analýzu nezávislých komponent se používají různé matematické vlastnosti signálů jako je např. špičatost a entropie. Signály, které byly smíšeny uměle v počítači, lze poměrně dobře oddělovat např. pomocí FastICA či algoritmu rostoucího gradientu. Složitější situace nastává, chceme-li oddělit signály pořízené v reálném nahrávacím prostředí, protože separaci řeči osob současně mluvících v reálném prostředí ovlivňují různé další okolnosti jako akustické vlastnosti místnosti, šum, zpoždění, odrazy od stěn, pozice či typ mikrofonů apod. Práce představuje postup analýzy nezávislých komponent ve frekvenční oblasti, který dokáže úspěšně oddělit i nahrávky pořízené v reálném prostředí.cs
dc.description.abstractThis thesis deals with multi-channel methods of speech enhancement. Multichannel methods of speech enhancement use a few microphones for recording signals. From mixtures of signals, for example, individual speakers can be separated, noise should be reduced etc. with using neural networks. The task of separating speakers is known as a cocktail-party effect. The main method of solving this problem is called independent component analysis. At first there are described its theoretical foundation and presented conditions and requirements for its application. Methods of ICA try to separate the mixtures with help of searching the minimal gaussian properties of signals. For the analysis of independent components are used different mathematical properties of signals such as kurtosis and entropy. Signals, which were mixed artificially on a computer, can be relatively well separated using, for example, FastICA algorithm or ICA gradient ascent. However, difficult is situation, if we want to separate the signals created in the real recording enviroment, because the separation of speech people speaking at the same time in the real environment affects other various factors such as acoustic properties of the room, noise, delays, reflections from the walls, the position or the type of microphones, etc. Work presents aproach of independent component analysis in the frequency domain, which can successfully separate also recordings made in the real environment.en
dc.description.markAcs
dc.identifier.citationZITKA, A. Vícekanálové metody zvýrazňování řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.cs
dc.identifier.other14312cs
dc.identifier.urihttp://hdl.handle.net/11012/18881
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectanalýza nezávislých komponentcs
dc.subjectICAcs
dc.subjectslepá separace zdrojůcs
dc.subjectcocktail-party efektcs
dc.subjectzvýrazňování řečics
dc.subjectindependent component analysisen
dc.subjectICAen
dc.subjectblind source separationen
dc.subjectcocktail-party effecten
dc.subjectspeech enhancementen
dc.titleVícekanálové metody zvýrazňování řečics
dc.title.alternativeMulti-channel Methods of Speech Enhancementen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2008-06-11cs
dcterms.modified2008-06-11-17:03:38cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid14312en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 20:09:51en
sync.item.modts2021.11.12 19:46:21en
thesis.disciplineTelekomunikační a informační technikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
645.15 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_14312.html
Size:
8.55 KB
Format:
Hypertext Markup Language
Description:
review_14312.html
Collections