Recognition of Audio Events Using Deep Neural Networks

but.committeeprof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře (C). Otázky u obhajoby: Precise, how the learning rate was set during the training. Explain the different metrics in the text output on page 24 of the report.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSchwarz, Petren
dc.contributor.authorUchytil, Alberten
dc.contributor.refereeČernocký, Janen
dc.date.created2016cs
dc.description.abstractZvuk je nositelem velkého množství informací. S rostoucí technickou úrovní společnosti se zvyšuje množství zvukových dat. Čím více dat máme, tím hůře se člověku zpracovávají. Tato práce se zabývá problematikou rozpoznávání zvukových událostí pomocí neuronových sítí. Konkrétně klasifikaci fonémů a jejich kategorií. Jako klasifikátor se používá model vícevrstevného perceptronu. Práce zkoumá závislost přesnosti tohoto klasifikačního modelu na nastavených vlastnostech a hledá optimální nastavení pro maximální přesnost. Přesnost je ovlivněna také vstupními daty. Práce zkoumá vztah mezi typem vstupních dat a úspěšností klasifikačního programu, a porovnává vlastnosti vybraných typů vstupních dat. Použití kontextu u vstupních dat redukuje rozdíly námi vybranými typy vstupních prvků. Čím větší kontext použijeme, tím větší přesnosti docílíme. Problém nastává v situaci, kdy začne kontext zasahovat do jiných tříd. Pro naše experimenty jsme používali neuronovou síť se třemi skrytými vrstvami.en
dc.description.abstractA lot of information is carried in sound. The amount of audio data is increasing with a growing technical level of the society. With more data, the task of processing it gets harder for human beings. This thesis is about recognition of audio events using neural networks. We focused on classification of phonemes and their categories. We used the Multilayer perceptron model as a classifier. We examined the relation between the accuracy of the model and its properties. Our goal was to estimate the network setup to obtain the best results. The accuracy is influenced by input features. We examine the relation between a type of the features and the success rate. The differences between input feature types are reduced by using the context. The bigger context we use the better results we get. Problem is, when contexts overlap, overlapping leads to a higher error rate. We have used a neural network with three hidden layers.cs
dc.description.markCcs
dc.identifier.citationUCHYTIL, A. Recognition of Audio Events Using Deep Neural Networks [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96570cs
dc.identifier.urihttp://hdl.handle.net/11012/62158
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRozpoznávání zvukuen
dc.subjectKlasifikace audiaen
dc.subjectNeuronové sítěen
dc.subjectKlasifikace fonémůen
dc.subjectSound recognitioncs
dc.subjectAudio classificationcs
dc.subjectNeural Networkscs
dc.subjectPhoneme classificationcs
dc.titleRecognition of Audio Events Using Deep Neural Networksen
dc.title.alternativeRecognition of Audio Events Using Deep Neural Networkscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2016-06-15cs
dcterms.modified2020-05-10-16:12:43cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96570en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 18:56:59en
sync.item.modts2025.01.15 12:15:51en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.24 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18850_v.pdf
Size:
85.2 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18850_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18850_o.pdf
Size:
86.64 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18850_o.pdf
Loading...
Thumbnail Image
Name:
review_96570.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
file review_96570.html
Collections