Interpretace neuronových sítí ve zpracování řeči

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Při interpretaci sítě klasifikující mluvčí jsou v Obrázcích 6.10, 6.12 a 6.14 uvedené i hodnoty relevancí. Jejich dynamický rozsah se diametrálně liší při použití různých LRP pravidel. Komentujte tento rozdíl. Jak se dynamický rozsah liší od rozsahů relevancí z experimentů týkajících se klasifikace pohlaví? V textu se několikrát vyskytuje tzv. "Clever Hans predictor". Vysvětlete, co pojem znamená a odkud se vzal právě tento název. Řídil jste se pouze původním článkem, nebo jste i vytvořil nějaká podstatná rozšíření?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorŽmolíková, Kateřinaen
dc.contributor.authorSarvaš, Mareken
dc.contributor.refereeMošner, Ladislaven
dc.date.created2021cs
dc.description.abstractS rastúcou popularitou hlbokých neurónových sietí, nedostatok transparentnosti spôsobenejich funkciou čiernej skrinky, zvyšuje dopyt po ich interpretácii. Cieľom tejto práce je získať nový pohľad na hlboké neurónové siete v úlohách spracovania reči. Konkrétne klasifikácia pohlavia z AudioMNIST datasetu a klasifikácia rečníka z filter bánk VoxCeleb datasetu s použitím konvolučnej a reziduálnej neurónovej siete. Na interpretáciu týchto neurónových sietí bola použitá metóda propagácie relevancií cez vrstvy. Táto metóda vytvorí tepelnú mapu, ktorá vyznačí príznaky, ktoré prispeli ku správnej klasifikácii pozitívne a ktoré negatívne. Ako výsledky interpretácie ukazujú, klasifikácie boli založené najmä na nižších frekvenciách v reči a čase. V prípade klasifikácie pohlavia sa mi podarilo nájsť vysokú závislosť modelu na veľmi malom počte príznakov. Pomocou získaných informácií som vytvoril rozšírený trénovací set, ktorý zvýšil robustnosť modelu.en
dc.description.abstractWith the growing popularity of deep neural networks, the lack of transparency caused by their black box representation is raising demand for their interpretability. The goal of this thesis is to gain new insights into deep neural networks in speech processing tasks. Specifically, gender classification task on AudioMNIST dataset and speaker classification task on filterbanks from VoxCeleb dataset using convolutional and residual neural network. Layer-wise relevance propagation was used for the interpretation of these neural networks. This method produced heatmaps highlighting features that contributed positively and negatively to the correct classification. As results of interpretation show, classifications were mainly based on lower frequencies in time. In the case of gender classification, I managed to find the model's high dependency on a small number of features. Using obtained information, I created an augmented training set that increased the model's robustness.cs
dc.description.markAcs
dc.identifier.citationSARVAŠ, M. Interpretace neuronových sítí ve zpracování řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136584cs
dc.identifier.urihttp://hdl.handle.net/11012/198950
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjecthlboké neuónové sieteen
dc.subjectkonvolučné neurónové sieteen
dc.subjectspracovanie rečien
dc.subjectinterpretácia neurónových sietíen
dc.subjectLayer-Wise Relevance Propagationen
dc.subjectdeep neural networkscs
dc.subjectconvolutional neural networkscs
dc.subjectspeech processingcs
dc.subjectinterpretation of neural networkscs
dc.subjectLayer-Wise Relevance Propagationcs
dc.titleInterpretace neuronových sítí ve zpracování řečien
dc.title.alternativeInterpretability of Neural Networks in Speech Processingcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-06-16cs
dcterms.modified2021-06-17-14:25:03cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136584en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:34:20en
sync.item.modts2025.01.17 13:12:57en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
9.34 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-24073_v.pdf
Size:
85.88 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-24073_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-24073_o.pdf
Size:
91.87 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-24073_o.pdf
Loading...
Thumbnail Image
Name:
review_136584.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_136584.html
Collections