Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data

but.committeedoc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. RNDr. Aleš Horák, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Q1: Můžete okomentovat, proč je na obr. 6.3 lepší 'iterativní' trénovaní, když později v obr. 7.4 je lepší trénování 'od začátku = from scratch'? Q2: Jakým způsobem by se dalo odhadnout, kolik řečových dat je nejméně potřeba pro 'dostatečně dobrý' odhad kovarianční matice z před-výstupní vrstvy neuronové sítě?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorKocour, Martinen
dc.contributor.refereeVeselý, Karelen
dc.date.accessioned2019-07-08T15:57:04Z
dc.date.available2019-07-08T15:57:04Z
dc.date.created2019cs
dc.description.abstractV dnešnej dobe systémy rozpoznávania reči s veľkým slovníkom dosahujú pomerne vysoké presnosti. Za ich výsledkami však často stoja desiatky ba až stovky hodín manuálne oanotovaných trénovacích dát. Takéto dáta sú často bežne nedostupné alebo pre požadovaný jazyk vôbec neexistujú. Možným riešením je použitie bežne dostupných no menej kvalitných audiovizuálnych dát. Táto práca sa zaoberá technikou zpracovania práve takýchto dát a ich použitím pre trénovanie akustických modelov. Ďalej táto práca pojednáva o možnom využití týchto dát pre kontinuálne vylepšovanie modelov, kedže tieto dáta sú prakticky nevyčerpateľné. Pre tieto účely bol v rámci práce navrhnutý nový prístup pre výber dát.en
dc.description.abstractToday's large vocabulary speech recognition systems are very accurate. However, tens or hundreds of hours of manually transcribed speech are needed in order to train such system. This kind of data is often unavailable, or they even do not exist for the desired language. A possible solution is to use commonly available but lower quality audiovisual data. This thesis addresses the methods of processing such data for semi-supervised training of acoustic models. Afterwards, it demonstrates how to continually improve already trained acoustic models by using these practically unlimited data. In this work is proposed a novel approach for selecting data based on similarity with the target domain.cs
dc.description.markAcs
dc.identifier.citationKOCOUR, M. Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122175cs
dc.identifier.urihttp://hdl.handle.net/11012/180422
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRozpoznávanie reči s veľkým slovníkomen
dc.subjecttrénovanie čiastočne s učiteľomen
dc.subjectneuronové sieteen
dc.subjectotitulkovaná rečen
dc.subjectakustické modelovanieen
dc.subjectLarge vocabulary continuous speech recognitioncs
dc.subjectsemi-supervised trainingcs
dc.subjecttime delay neural networkcs
dc.subjectsubtitled speech datacs
dc.subjectacoustic modellingcs
dc.titleAutomatic Speech Recognition System Continually Improving Based on Subtitled Speech Dataen
dc.title.alternativeAutomatic Speech Recognition System Continually Improving Based on Subtitled Speech Datacs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-19cs
dcterms.modified2019-07-08-13:31:31cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122175en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 22:23:31en
sync.item.modts2021.11.22 21:48:50en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.44 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22041_v.pdf
Size:
86.06 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22041_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22041_o.pdf
Size:
87.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22041_o.pdf
Loading...
Thumbnail Image
Name:
review_122175.html
Size:
1.5 KB
Format:
Hypertext Markup Language
Description:
review_122175.html
Collections