Rekurentní neuronové sítě pro rozpoznávání řeči

but.committeedoc. Ing. František Zbořil, CSc. (předseda) prof. Ing. Lukáš Sekanina, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) prof. Ing. Radomil Matoušek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře (C). Otázky u obhajoby: Rmsprop a grmsprop technika trénování neuronových sítí vám vycházela nejlépe, nicméně v práci je o ní minimum technických informací. Můžete ji popsat a zdůvodnit proč dává dobré výsledky? Jaký je rozdíl v úspěšnosti standardních a CTC systémů? V čem si myslíte, že spočívá problém nestability CTC algoritmu?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorVeselý, Karelcs
dc.contributor.authorNováčik, Tomášcs
dc.contributor.refereeKarafiát, Martincs
dc.date.created2016cs
dc.description.abstractTato diplomová práce se zabývá implementací rekurentních neuronových sítí v prostředí jazyka lua za pomocí knihovny torch. Řeší problematiku trénování rekurentních neuronových sítí a to jak z hlediska optimální trénovací strategie, tak z hlediska urychlení trénovacího procesu. Zkoumá zakomponování technik batch normalizace a dropout do architektur rekurentních neuronových sítí. Jednotlivé typy rekurentních sítí jsou následně porovnány na úkolu rozpoznávání řeči prostřednictvým datové sady AMI, kde slouží pro modelování akustického modelu, a dochází ke srovnání s klasickou dopřednou neuronovou sítí. Nejlepší výsledek je dosažen prostřednictvým rekurentní neuronové sítě BLSTM. Následně dojde k natrénování rekurentních neuronových sítí prostřednictvím objektivní funkce CTC na databázi TIMIT, kde nejlepšího výsledku opět dosáhne BLSTM.cs
dc.description.abstractThis master thesis deals with the implementation of various types of recurrent neural networks via programming language lua using torch library. It focuses on finding optimal strategy for training recurrent neural networks and also tries to minimize the duration of the training. Furthermore various types of regularization techniques are investigated and implemented into the recurrent neural network architecture. Implemented recurrent neural networks are compared on the speech recognition task using AMI dataset, where they model the acustic information. Their performance is also compared to standard feedforward neural network. Best results are achieved using BLSTM architecture. The recurrent neural network are also trained via CTC objective function on the TIMIT dataset. Best result is again achieved using BLSTM architecture.en
dc.description.markCcs
dc.identifier.citationNOVÁČIK, T. Rekurentní neuronové sítě pro rozpoznávání řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96593cs
dc.identifier.urihttp://hdl.handle.net/11012/61863
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectctccs
dc.subjectirnncs
dc.subjectrnncs
dc.subjectlstmcs
dc.subjectgrucs
dc.subjectkaldics
dc.subjecteesencs
dc.subjectrekurentní neuronové sítěcs
dc.subjectrozpoznávání řečics
dc.subjecttorchcs
dc.subjectparalelní zpracování sekvencícs
dc.subjectakustický modelcs
dc.subjectbatch normalizacecs
dc.subjectamics
dc.subjecttimitcs
dc.subjectctcen
dc.subjectirnnen
dc.subjectrnnen
dc.subjectlstmen
dc.subjectgruen
dc.subjectkaldien
dc.subjecteesenen
dc.subjectrecurrent neural networksen
dc.subjectspeech recognitionen
dc.subjecttorchen
dc.subjectparallel sequence processingen
dc.subjectacustic modelen
dc.subjectbatch normalizationen
dc.subjectamien
dc.subjecttimiten
dc.titleRekurentní neuronové sítě pro rozpoznávání řečics
dc.title.alternativeRecurrent Neural Networks for Speech Recognitionen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-21cs
dcterms.modified2020-05-10-16:12:44cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96593en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:22:13en
sync.item.modts2025.01.15 17:17:52en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.1 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18910_v.pdf
Size:
86.2 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18910_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18910_o.pdf
Size:
96.43 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18910_o.pdf
Loading...
Thumbnail Image
Name:
review_96593.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_96593.html
Collections