Modelování jazyka v rozpoznávání češtiny

but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorMikolov, Tomášcs
dc.contributor.refereeČernocký, Jancs
dc.date.createdcs
dc.description.abstractTato práce se zabývá problematikou jazykových modelů v oblasti automatického přepisu mluvené řeči. V teoretické části jsou rozebrány současně používané metody pro pokročilé jazykové modelování založené na statistickém přístupu - modely založené na třídách, na faktorech a na neuronových sítích. Následně je popsána implementace jazykového modelu založeného na dvou neuronových sítích. V závěru práce jsou uvedeny výsledky dosažené na Pražském a Brněnském mluveném korpusu (cca 1 170 000 slov) - redukce perplexity o zhruba 20%. Výsledky dosažené při reskórování N-best listů ukazují zlepšení při rozpoznávání spontánní řeči o více než 1%. V závěru práce jsou uvedeny možnosti využití práce, její možná rozšíření a také jsou uvedeny hlavní nevýhody současně používaných přístupů pro statistické jazykové modelování.cs
dc.description.abstractThis work concerns the problematic of language modeling in automatic speech recognition. Currently widely used techniques for advanced language modeling based on statistical approach are described in the first part of work - class based language models, factored language models and neural network based language models. In the next section, implementation of neural network based language model is described. Results obtained on "Pražský mluvený korpus" and "Brněnský mluvený korpus" corpora (1 170 000 words) are reported, with perplexity reduction around 20%. Also, results obtained after rescoring N-best lists with spontaneous speech are reported, with absolute improvement in accuracy by more than 1%. In the conclusion, possible uses of the work are mentioned, along with possible extensions in the future. Finally, main weaknesses of current statistical language modeling techniques are described.en
dc.description.markAcs
dc.identifier.citationMIKOLOV, T. Modelování jazyka v rozpoznávání češtiny [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other15263cs
dc.identifier.urihttp://hdl.handle.net/11012/54054
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectjazykový modelcs
dc.subjectčeštinacs
dc.subjectn-gramové statistikycs
dc.subjectneuronové sítěcs
dc.subjectrozpoznávání řečics
dc.subjectumělá inteligencecs
dc.subjectlanguage modelingen
dc.subjectCzech languageen
dc.subjectn-gram statisticsen
dc.subjectneural networksen
dc.subjectspeech recognitionen
dc.subjectartificial intelligenceen
dc.titleModelování jazyka v rozpoznávání češtinycs
dc.title.alternativeLanguage Modeling for Spech Recognition in Czechen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.modified2020-05-09-23:39:37cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid15263en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:43:53en
sync.item.modts2025.01.15 13:07:33en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
443.16 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_15263.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
file review_15263.html
Collections