Detekce a obnova slov mimo slovník

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) Mirko Hannemann, Ph.D. (člen) doc. RNDr. Aleš Horák, Ph.D. (člen) doc. RNDr. Pavel Pecina, Ph.D. (člen) Dr. Thomas Schaaf (člen)cs
but.defenceThe student presented the goals and results, which she achieved within the solution of the dissertation. The student has competently answered the questions of the committee members. The discussion is recorded on the discussion sheets, which are attached to the protocol. Number of discussion sheets: 2. The committee has agreed unanimously that the student has fulfilled requirements for being awarded the academic title Ph.D.cs
but.jazykangličtina (English)
but.programVýpočetní technika a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorEgorova, Ekaterinaen
dc.contributor.refereeHannemann, Mirkoen
dc.contributor.refereeSchaaf, Thomasen
dc.date.accessioned2023-08-30T06:54:50Z
dc.date.available2023-08-30T06:54:50Z
dc.date.createdcs
dc.description.abstractTato disertační práce zkoumá oblast zpracování slov mimo slovník (out-of-vocabulary word, OOV) v rámci úlohy automatického rozpoznávání řeči (automatic speech recognition, ASR). Definuje dvě samostatné úlohy zpracování OOV - detekci a obnovu - a pro obě úlohy navrhuje metriky úspěšnosti. Prezentuje několik přístupů k detekci a obnově OOV v rámci hybridních a end-to-end (E2E) ASR systémů. Experimentální práce a srovnání přístupů bylo provedeno na otevřené databázi LibriSpeech, aby byla zajištěna reprodukovatelnost experimentů.  Hybridní přístup využívá upravený dekódovací graf s fonémovými podřetězci a pro detekci a obnovu opakujících se OOV využívá reprezentaci založenou na plných rozpoznávacích grafech (lattices). Obnovená OOV jsou přidána do slovníku a jazykového modelu (LM), což vede ke zlepšení úspěšnosti ASR systému. Druhý přístup využívá k řešení úlohy detekce OOV vnitřní reprezentace systému E2E architektury "Listen Attend and Spell" (LAS) s predikcí slov. Tato metoda oproti hybridnímu přístupu výrazně zlepšuje míru úplnosti a přesnosti (recall a precision). Obnova opakujících se OOV se provádí pomocí samostatného systému predikce znaků s využitím detekovaných časových rámců a pravděpodobnostního shlukování.Nakonec navrhujeme novou "speller" architekturu se schopností učit se reprezentace OOV společně s trénováním sítě pro predikci slov (word predicting network, WPN). Komponent "speller" ovlivňuje během trénování slovní embeddingy tak, aby dobře reprezentovaly i fonetickou podobu slov, a tím zajišťuje nejen možnost kvalitní obnovy OOV, ale i zlepšení výkonu sítě pro predikci slov.en
dc.description.abstractThe thesis explores the field of out-of-vocabulary word (OOV) processing within the task of automatic speech recognition (ASR). It defines the two separate OOV processing tasks - that of detection and recovery - and proposes success metrics for both the tasks. Different approaches to OOV detection and recovery are presented within the frameworks of hybrid and end-to-end (E2E) ASR. These approaches and compared on an open access LibriSpeech database to facilitate replicability. Hybrid approach uses modified decoding graph with phoneme substrings and utilizes full lattice representations for detection and recovery of recurrent OOVs. Recovered OOVs are added to the dictionary and the language model (LM) to improve ASR system performance.  The second approach employs inner representations of a word-predicting Listen Attend and Spell architecture (LAS) E2E system to perform OOV detection task. Detection recall and precision rates improved drastically in comparison with the hybrid approach. Recur-rent OOV recovery is performed on a separate character-predicting system with the use of detected time frames and probabilistic clustering.Finally, we propose a new speller architecture with a capability of learning OOV representations together with the word predicting network (WPN) training. The speller forces word embeddings to be spelling-aware during the training and thus not only provides OOV recovery, but also improves the WPN performance.cs
dc.description.markPcs
dc.identifier.citationEGOROVA, E. Detekce a obnova slov mimo slovník [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other150754cs
dc.identifier.urihttp://hdl.handle.net/11012/213823
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSlova mimo slovníken
dc.subjectautomatické rozpoznávání řečien
dc.subjecthybridní ASRen
dc.subjectE2E ASRen
dc.subjectneurální architekturyen
dc.subjectListen Attend and Spell.en
dc.subjectout-of-vocabulary wordscs
dc.subjectautomatic speech recognitioncs
dc.subjecthybrid ASRcs
dc.subjectend-to-end ASRcs
dc.subjectneural architecturescs
dc.subjectListen Attend and Spell.cs
dc.titleDetekce a obnova slov mimo slovníken
dc.title.alternativeOut-of-Vocabulary Words Detection and Recoverycs
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.modified2022-12-16-17:19:21cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid150754en
sync.item.dbtypeZPen
sync.item.insts2023.08.30 08:54:50en
sync.item.modts2023.08.30 08:13:41en
thesis.disciplineVýpočetní technika a informatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 5
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
16.59 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-768_s1.pdf
Size:
54.35 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-768_s1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-768_o1.pdf
Size:
1.73 MB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-768_o1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-768_o2.pdf
Size:
130.79 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-768_o2.pdf
Loading...
Thumbnail Image
Name:
review_150754.html
Size:
1.64 KB
Format:
Hypertext Markup Language
Description:
review_150754.html
Collections