Exploring Contextual Information in Neural Machine Translation

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda) Ing. Matěj Grégr, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) prof. Ing. Radomil Matoušek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelen
dc.contributor.authorJon, Josefen
dc.contributor.refereeFajčík, Martinen
dc.date.created2019cs
dc.description.abstractTato práce se zabývá zapojením mezivětného kontextu v neuronovém strojovém překladu (NMT). Dnešní běžné NMT systémy překládají jednu zdrojovou větu na jednu cílovou větu, bez jakéhokoliv ohledu na okolní text. Tento přístup je nedostačující a neodpovídá způsobu práce lidských překladatelů. Pro mnoho jazykových párů je dnes za splnění určitých (přísných) podmínek výstup NMT nerozeznatelný od lidského překladu. Jedna z těchto podmínek je, že hodnotitelé skórují přeložené věty nezávisle, bez znalosti kontextu. Při hodnocení celých dokumentů je výstup NMT stále hodnocen hůře, než lidský překlad, i v případech, kdy byl na úrovni jednotlivých vět preferován. Tato zjištění jsou motivací pro výzkum zapojení kontextu na úrovni dokumentu v NMT, je totiž možné, že na úrovni vět již není mnoho prostoru ke zlepšení, alespoň pro jazykové páry a domény bohaté na trénovací data. Tato práce shrnuje současné přístupy zapojení kontextu do překladu, několik z nich je implementováno a vyhodnoceno v rámci obecné překladové kvality i na překladu specifických fenoménů souvisejících s kontextem. Pro zhodnocení kvality jednotlivých systému byla ručně vytvořena testovací sada pro překlad z anglického do českého jazyka.en
dc.description.abstractThis works explores means of utilizing extra-sentential context in neural machine translation (NMT). Traditionally, NMT systems translate one source sentence into one target sentence, without any notion of the surrounding text. This is clearly insufficient and different from how humans translate text. For many high-resource language pairs, translations produced by NMT may be under certain, strict conditions, nearly indistinguishable from human produced translations. One of these conditions is that evaluators score the sentences separately. When evaluating whole documents, even the best NMT systems still fall short of human translators. This motivates the research of employing document level context in NMT, since there might not be much more space left to improve translations on the sentence level, at least for high resource languages and domains. This work summarizes recent state-of-the art approaches to context utilization, implements several of them, evaluates them both in terms of general translation quality and on specific context related phenomena, and analyzes their advantages and shortcomings. A hand-made context phenomena test set for English to Czech translation was created for this task.cs
dc.description.markAcs
dc.identifier.citationJON, J. Exploring Contextual Information in Neural Machine Translation [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122136cs
dc.identifier.urihttp://hdl.handle.net/11012/180410
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectNMTen
dc.subjectneuronový strojový překladen
dc.subjectkontexten
dc.subjectrekurentní neuronové sítěen
dc.subjecttransformeren
dc.subjectstrojový překlad na úrovni dokumentůen
dc.subjectdiskurzen
dc.subjectNMTcs
dc.subjectneural machine translationcs
dc.subjectcontextcs
dc.subjectrecurrent neural networkscs
dc.subjecttransformercs
dc.subjectdocument level translationcs
dc.subjectdiscoursecs
dc.subjectcohesioncs
dc.subjectcoherencecs
dc.titleExploring Contextual Information in Neural Machine Translationen
dc.title.alternativeExploring Contextual Information in Neural Machine Translationcs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-20cs
dcterms.modified2019-07-08-13:31:30cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122136en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:29:30en
sync.item.modts2025.01.17 13:40:10en
thesis.disciplineBioinformatika a biocomputingcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.06 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21979_v.pdf
Size:
85.92 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21979_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21979_o.pdf
Size:
94.84 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21979_o.pdf
Loading...
Thumbnail Image
Name:
review_122136.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_122136.html
Collections