Co nejlepší rozpoznávač řeči na vlastních datech

but.committeedoc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Q1: Vysvětlete princip fungování log-lineární interpolace jazykových modelů. Co se děje se skore častých a málo častých slov, když má jazykový model negativní exponent? (např. v tabulce 5.2) Q2: Která oblast praktické části byla nejpracnější a která další byla náročná? Jak probíhá učení akustického modelu? Bude systém běžet offline nebo online (přímo během řeči)?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igoren
dc.contributor.authorSýkora, Tomášen
dc.contributor.refereeVeselý, Karelen
dc.date.accessioned2023-07-17T08:06:45Z
dc.date.available2023-07-14cs
dc.date.available2023-07-17T08:06:45Z
dc.date.created2020cs
dc.description.abstractDenno-denne vzniká množstvo špičkových objavov v oblasti strojového učenia. Prispôsobením týchto sýstémov tak, aby čo najlepšie fungovali iba na obmedzenej podmnožine všeobecných dát, môžu byť dosiahnuté výrazné zlepšenia v prenosti. Prispôsobením automatického rozpoznávača reči na doménovo špecifické dáta je možné vytvoriť produkt dosahujúci omnoho lepšie výsledky ako rozpoznávač reči natrénovaný na všeobecných dátach. Táto práca prezentuje 17-percentné zlepšenie chybovosti prepísaných slov oproti automatickému rozpoznávaču reči ponúkaného službou Google Speech. Toto zlepšenie bolo dosiahnuté precíznou anotáciou a prípravou doménových dát a kombináciou špičkových techník a algoritmov v oblasti automatického rozpoznávania reči. Popísaný systém bol úspešne nasadený do výrobného prostredia transkripčnej spoločnosti Parrot, ktorej súčasťou som od jej začiatku. Nasadený systém výrazne zvýšil efektivitu zamestancov používajúcich výstup popísaného rozpoznávača.en
dc.description.abstractMany state-of-the-art results in different machine learning areas are presented on day-to-day basis. By adjusting these systems to perform perfectly on a specific subset of all general data, huge improvements may be achieved in their resulting accuracy. Usage of domain adaptation in automatic speech recognition can bring us to production level models capable of transcribing difficult and noisy customer conversations way more accurately than the general models trained on all kinds of language and speech data. In this work I present 17% word error rate improvement in our speech recognition task over the general domain speech recognizer from Google. The improvement was achieved by both very precise annotation and preparation of domain data and by combining state-of-the-art techniques and algorithms. The described system was successfully integrated into a production environment of the Parrot transcription company, where I am a member of the initial team, which drastically increased performance of the human transcribers.cs
dc.description.markAcs
dc.identifier.citationSÝKORA, T. Co nejlepší rozpoznávač řeči na vlastních datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129247cs
dc.identifier.urihttp://hdl.handle.net/11012/211891
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/letcs
dc.subjectautomatické rozpoznávanie rečien
dc.subjectdoménové dátaen
dc.subjectkaldien
dc.subjectdataseten
dc.subjectčistenie rečových dáten
dc.subjectautomatic speech recognitioncs
dc.subjectdomain datacs
dc.subjectkaldics
dc.subjectdatasetcs
dc.subjectspeech data cleaningcs
dc.titleCo nejlepší rozpoznávač řeči na vlastních datechen
dc.title.alternativeThe Best Possible Speech Recognizer on Your Own Datacs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2020-07-14cs
dcterms.modified2020-07-17-14:40:14cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129247en
sync.item.dbtypeZPen
sync.item.insts2023.07.17 10:06:45en
sync.item.modts2023.07.17 09:27:56en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18056_v.pdf
Size:
86.3 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18056_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18056_o.pdf
Size:
88.5 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18056_o.pdf
Loading...
Thumbnail Image
Name:
review_129247.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_129247.html
Collections