Statistické jazykové modely založené na neuronových sítích
but.jazyk | angličtina (English) | |
but.program | Výpočetní technika a informatika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Černocký, Jan | en |
dc.contributor.author | Mikolov, Tomáš | en |
dc.contributor.referee | Zweig, Geoffrey | en |
dc.contributor.referee | Hajič,, Jan | en |
dc.date.created | cs | |
dc.description.abstract | Statistické jazykové modely jsou důležitou součástí mnoha úspěšných aplikací, mezi něž patří například automatické rozpoznávání řeči a strojový překlad (příkladem je známá aplikace Google Translate). Tradiční techniky pro odhad těchto modelů jsou založeny na tzv. N-gramech. Navzdory známým nedostatkům těchto technik a obrovskému úsilí výzkumných skupin napříč mnoha oblastmi (rozpoznávání řeči, automatický překlad, neuroscience, umělá inteligence, zpracování přirozeného jazyka, komprese dat, psychologie atd.), N-gramy v podstatě zůstaly nejúspěšnější technikou. Cílem této práce je prezentace několika architektur jazykových modelůzaložených na neuronových sítích. Ačkoliv jsou tyto modely výpočetně náročnější než N-gramové modely, s technikami vyvinutými v této práci je možné jejich efektivní použití v reálných aplikacích. Dosažené snížení počtu chyb při rozpoznávání řeči oproti nejlepším N-gramovým modelům dosahuje 20%. Model založený na rekurentní neurovové síti dosahuje nejlepších publikovaných výsledků na velmi známé datové sadě (Penn Treebank). | en |
dc.description.abstract | Statistical language models are crucial part of many successful applications, such as automatic speech recognition and statistical machine translation (for example well-known Google Translate). Traditional techniques for estimating these models are based on Ngram counts. Despite known weaknesses of N-grams and huge efforts of research communities across many fields (speech recognition, machine translation, neuroscience, artificial intelligence, natural language processing, data compression, psychology etc.), N-grams remained basically the state-of-the-art. The goal of this thesis is to present various architectures of language models that are based on artificial neural networks. Although these models are computationally more expensive than N-gram models, with the presented techniques it is possible to apply them to state-of-the-art systems efficiently. Achieved reductions of word error rate of speech recognition systems are up to 20%, against stateof-the-art N-gram model. The presented recurrent neural network based model achieves the best published performance on well-known Penn Treebank setup. | cs |
dc.description.mark | P | cs |
dc.identifier.citation | MIKOLOV, T. Statistické jazykové modely založené na neuronových sítích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. . | cs |
dc.identifier.other | 99806 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/63271 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | jazykový model | en |
dc.subject | neuronová sít’ | en |
dc.subject | rekurentní | en |
dc.subject | maximální entropie | en |
dc.subject | rozpoznávání řeči | en |
dc.subject | komprese dat | en |
dc.subject | umělá inteligence | en |
dc.subject | language model | cs |
dc.subject | neural network | cs |
dc.subject | recurrent | cs |
dc.subject | maximum entropy | cs |
dc.subject | speech recognition | cs |
dc.subject | data compression | cs |
dc.subject | artificial intelligence | cs |
dc.title | Statistické jazykové modely založené na neuronových sítích | en |
dc.title.alternative | STATISTICAL LANGUAGE MODELS BASED ON NEURAL NETWORKS | cs |
dc.type | Text | cs |
dc.type.driver | doctoralThesis | en |
dc.type.evskp | dizertační práce | cs |
dcterms.modified | 2020-05-10-17:46:41 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 99806 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.27 12:11:43 | en |
sync.item.modts | 2025.01.15 20:04:31 | en |
thesis.discipline | Výpočetní technika a informatika | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Doktorský | cs |
thesis.name | Ph.D. | cs |
Files
Original bundle
1 - 5 of 6
Loading...
- Name:
- final-thesis.pdf
- Size:
- 794.3 KB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- thesis-1.pdf
- Size:
- 286.63 KB
- Format:
- Adobe Portable Document Format
- Description:
- thesis-1.pdf
Loading...
- Name:
- Posudek-Vedouci prace-283_s1.pdf
- Size:
- 57.46 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-283_s1.pdf
Loading...
- Name:
- Posudek-Oponent prace-283_o1.pdf
- Size:
- 943.4 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-283_o1.pdf
Loading...
- Name:
- Posudek-Oponent prace-283_o2.pdf
- Size:
- 845.88 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-283_o2.pdf