Nízko-dimenzionální faktorizace pro "End-To-End" řečové systémy

but.committeedoc. Dr. Ing. Jan Černocký (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) Ing. Vítězslav Beran, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Můžete uvést čas potřebný pro natrénování sítě TDNN-F+BLSTMP a BLSTMP (tabulka 6.19)? Krátce uveďte rozdíly mezi oběma topologiemi. Pytorch implementace TDNN se dle vašich výsledků trénuje 10x pomaleji než je tomu v Kadi. V čem jsou hlavní důvody tohoto rozdílu? V pytorch implementaci jste použil jinou topologii TDNN(-F) sítě než je topologie v Kaldi. Můžete porovnat výsledky Kadi a pytorch topologie?cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKarafiát, Martinsk
dc.contributor.authorGajdár, Matúšsk
dc.contributor.refereeGrézl, Františeksk
dc.date.accessioned2020-07-20T19:58:04Z
dc.date.available2020-07-20T19:58:04Z
dc.date.created2020cs
dc.description.abstractPráca sa zaoberá problematikou rozpoznávania reči s pomocou učenia neurónových sietí, na ktoré je aplikovaný algoritmus nízko-dimenzionálnej faktorizácie. V práci je popísaná implementácia časovo oneskorených neurónových sietí s faktorizáciou (TDNN-F) a bez nej (TDNN) v jazyku Pytorch. Následne je porovnávaná s už existujúcou implementáciou v nástroji Kaldi, kde boli dosiahnuté podobné výsledky v rámci experimentovania s rôznymi architektúrami. V poslednej kapitole popisujeme dopad nízko-dimenzionálnej faktorizácie na 'End-to-End' (E2E) rečové systémy a taktiež modifikovanie systému s TDNN(-F) sieťami. Pri experimentoch sa nám v určitých nastaveniach sietí s faktorizáciou podarilo zlepšiť výsledky.Súčasne sme pomocou TDNN(-F) sietí dokázali zmenšiť komplexnosť učenia redukciou veľkosti siete.sk
dc.description.abstractThe project covers automatic speech recognition with neural network training using low-dimensional matrix factorization. We are describing time delay neural networks with factorization (TDNN-F) and without it (TDNN) in Pytorch language. We are comparing the implementation between Pytorch and Kaldi toolkit, where we achieve similar results during experiments with various network architectures. The last chapter describes the impact of a low-dimensional matrix factorization on End-to-End speech recognition systems and also a modification of the system with TDNN(-F) networks. Using specific network settings, we were able to achieve better results with systems using factorization. Additionally, we reduced the complexity of training by decreasing network parameters with the use of TDNN(-F) networks.en
dc.description.markBcs
dc.identifier.citationGAJDÁR, M. Nízko-dimenzionální faktorizace pro "End-To-End" řečové systémy [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129346cs
dc.identifier.urihttp://hdl.handle.net/11012/192526
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectAutomatické rozpoznávanie rečisk
dc.subjectkonvolučné neurónové sietesk
dc.subjectTDNNsk
dc.subjectnízko-dimenzionálna faktorizáciask
dc.subjectE2Esk
dc.subjectTDNN-Fsk
dc.subjectPytorchsk
dc.subjectKaldisk
dc.subjectESPnetsk
dc.subjectAutomatic speech recognitionen
dc.subjectconvolution neural networksen
dc.subjectTDNNen
dc.subjectlow-dimensional matrix factorizationen
dc.subjectE2Een
dc.subjectTDNN-Fen
dc.subjectPytorchen
dc.subjectKaldien
dc.subjectESPneten
dc.titleNízko-dimenzionální faktorizace pro "End-To-End" řečové systémysk
dc.title.alternativeLow-Dimensional Matrix Factorization in End-To-End Speech Recognition Systemsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2020-07-15cs
dcterms.modified2020-07-17-14:42:11cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129346en
sync.item.dbtypeZPen
sync.item.insts2021.11.10 14:16:49en
sync.item.modts2021.11.10 13:02:26en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.29 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23195_o.pdf
Size:
90.76 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23195_o.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23195_v.pdf
Size:
85.89 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23195_v.pdf
Loading...
Thumbnail Image
Name:
review_129346.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
review_129346.html
Collections