Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data
but.committee | doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. RNDr. Aleš Horák, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Q1: Můžete okomentovat, proč je na obr. 6.3 lepší 'iterativní' trénovaní, když později v obr. 7.4 je lepší trénování 'od začátku = from scratch'? Q2: Jakým způsobem by se dalo odhadnout, kolik řečových dat je nejméně potřeba pro 'dostatečně dobrý' odhad kovarianční matice z před-výstupní vrstvy neuronové sítě? | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Černocký, Jan | en |
dc.contributor.author | Kocour, Martin | en |
dc.contributor.referee | Veselý, Karel | en |
dc.date.accessioned | 2019-07-08T15:57:04Z | |
dc.date.available | 2019-07-08T15:57:04Z | |
dc.date.created | 2019 | cs |
dc.description.abstract | V dnešnej dobe systémy rozpoznávania reči s veľkým slovníkom dosahujú pomerne vysoké presnosti. Za ich výsledkami však často stoja desiatky ba až stovky hodín manuálne oanotovaných trénovacích dát. Takéto dáta sú často bežne nedostupné alebo pre požadovaný jazyk vôbec neexistujú. Možným riešením je použitie bežne dostupných no menej kvalitných audiovizuálnych dát. Táto práca sa zaoberá technikou zpracovania práve takýchto dát a ich použitím pre trénovanie akustických modelov. Ďalej táto práca pojednáva o možnom využití týchto dát pre kontinuálne vylepšovanie modelov, kedže tieto dáta sú prakticky nevyčerpateľné. Pre tieto účely bol v rámci práce navrhnutý nový prístup pre výber dát. | en |
dc.description.abstract | Today's large vocabulary speech recognition systems are very accurate. However, tens or hundreds of hours of manually transcribed speech are needed in order to train such system. This kind of data is often unavailable, or they even do not exist for the desired language. A possible solution is to use commonly available but lower quality audiovisual data. This thesis addresses the methods of processing such data for semi-supervised training of acoustic models. Afterwards, it demonstrates how to continually improve already trained acoustic models by using these practically unlimited data. In this work is proposed a novel approach for selecting data based on similarity with the target domain. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | KOCOUR, M. Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 122175 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180422 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Rozpoznávanie reči s veľkým slovníkom | en |
dc.subject | trénovanie čiastočne s učiteľom | en |
dc.subject | neuronové siete | en |
dc.subject | otitulkovaná reč | en |
dc.subject | akustické modelovanie | en |
dc.subject | Large vocabulary continuous speech recognition | cs |
dc.subject | semi-supervised training | cs |
dc.subject | time delay neural network | cs |
dc.subject | subtitled speech data | cs |
dc.subject | acoustic modelling | cs |
dc.title | Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data | en |
dc.title.alternative | Automatic Speech Recognition System Continually Improving Based on Subtitled Speech Data | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2019-06-19 | cs |
dcterms.modified | 2019-07-08-13:31:31 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 122175 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.22 22:23:31 | en |
sync.item.modts | 2021.11.22 21:48:50 | en |
thesis.discipline | Inteligentní systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.44 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-22041_v.pdf
- Size:
- 86.06 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-22041_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-22041_o.pdf
- Size:
- 87.11 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-22041_o.pdf
Loading...
- Name:
- review_122175.html
- Size:
- 1.5 KB
- Format:
- Hypertext Markup Language
- Description:
- review_122175.html