Exploring Contextual Information in Neural Machine Translation
but.committee | prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda) Ing. Matěj Grégr, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) prof. Ing. Radomil Matoušek, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | en |
dc.contributor.author | Jon, Josef | en |
dc.contributor.referee | Fajčík, Martin | en |
dc.date.created | 2019 | cs |
dc.description.abstract | Tato práce se zabývá zapojením mezivětného kontextu v neuronovém strojovém překladu (NMT). Dnešní běžné NMT systémy překládají jednu zdrojovou větu na jednu cílovou větu, bez jakéhokoliv ohledu na okolní text. Tento přístup je nedostačující a neodpovídá způsobu práce lidských překladatelů. Pro mnoho jazykových párů je dnes za splnění určitých (přísných) podmínek výstup NMT nerozeznatelný od lidského překladu. Jedna z těchto podmínek je, že hodnotitelé skórují přeložené věty nezávisle, bez znalosti kontextu. Při hodnocení celých dokumentů je výstup NMT stále hodnocen hůře, než lidský překlad, i v případech, kdy byl na úrovni jednotlivých vět preferován. Tato zjištění jsou motivací pro výzkum zapojení kontextu na úrovni dokumentu v NMT, je totiž možné, že na úrovni vět již není mnoho prostoru ke zlepšení, alespoň pro jazykové páry a domény bohaté na trénovací data. Tato práce shrnuje současné přístupy zapojení kontextu do překladu, několik z nich je implementováno a vyhodnoceno v rámci obecné překladové kvality i na překladu specifických fenoménů souvisejících s kontextem. Pro zhodnocení kvality jednotlivých systému byla ručně vytvořena testovací sada pro překlad z anglického do českého jazyka. | en |
dc.description.abstract | This works explores means of utilizing extra-sentential context in neural machine translation (NMT). Traditionally, NMT systems translate one source sentence into one target sentence, without any notion of the surrounding text. This is clearly insufficient and different from how humans translate text. For many high-resource language pairs, translations produced by NMT may be under certain, strict conditions, nearly indistinguishable from human produced translations. One of these conditions is that evaluators score the sentences separately. When evaluating whole documents, even the best NMT systems still fall short of human translators. This motivates the research of employing document level context in NMT, since there might not be much more space left to improve translations on the sentence level, at least for high resource languages and domains. This work summarizes recent state-of-the art approaches to context utilization, implements several of them, evaluates them both in terms of general translation quality and on specific context related phenomena, and analyzes their advantages and shortcomings. A hand-made context phenomena test set for English to Czech translation was created for this task. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | JON, J. Exploring Contextual Information in Neural Machine Translation [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 122136 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180410 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | NMT | en |
dc.subject | neuronový strojový překlad | en |
dc.subject | kontext | en |
dc.subject | rekurentní neuronové sítě | en |
dc.subject | transformer | en |
dc.subject | strojový překlad na úrovni dokumentů | en |
dc.subject | diskurz | en |
dc.subject | NMT | cs |
dc.subject | neural machine translation | cs |
dc.subject | context | cs |
dc.subject | recurrent neural networks | cs |
dc.subject | transformer | cs |
dc.subject | document level translation | cs |
dc.subject | discourse | cs |
dc.subject | cohesion | cs |
dc.subject | coherence | cs |
dc.title | Exploring Contextual Information in Neural Machine Translation | en |
dc.title.alternative | Exploring Contextual Information in Neural Machine Translation | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2019-06-20 | cs |
dcterms.modified | 2019-07-08-13:31:30 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 122136 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:29:30 | en |
sync.item.modts | 2025.01.17 13:40:10 | en |
thesis.discipline | Bioinformatika a biocomputing | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.06 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-21979_v.pdf
- Size:
- 85.92 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-21979_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-21979_o.pdf
- Size:
- 94.84 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-21979_o.pdf
Loading...
- Name:
- review_122136.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_122136.html