Bilingual Dictionary Based Neural Machine Translation

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKesiraju, Santoshen
dc.contributor.authorTikhonov, Maksimen
dc.contributor.refereeBeneš, Karelen
dc.date.created2023cs
dc.description.abstractVývoj v oblasti strojového překladu v posledních několika letech ukázal, že moderní neuronové systémy strojového překladu jsou schopny poskytovat výsledky vynikající kvality. Pro získání takového systému je však zapotřebí velké množství paralelních trénovacích dat, která nejsou pro většinu jazyků k dispozici. Jedním ze způsobů zlepšení kvality strojového překladu pro low-resource jazyky je augmentace dat. Tato práce zkoumá úlohu neuronového strojového překladu založeného na bilingválních slovnících, jejíž základem je použití augmentační techniky umožňující generování zašuměných dat na základě bilingválních slovníků. Mým cílem bylo prozkoumat možnosti systémů založených na této metodě na různých jazykových párech a za různých výchozích podmínek a následně porovnat získané výsledky s výsledky tradičních neuronových systémů strojového překladu.en
dc.description.abstractThe development in the recent few years in the field of machine translation showed us that modern neural machine translation systems are capable of providing results of outstanding quality. However, in order to obtain such a system, one requires an abundant amount of parallel training data, which is not available for most languages. One of the ways to improve the quality of machine translation of low-resource languages is data augmentation. This work investigates the task of Bilingual dictionary-based neural machine translation (BDBNMT), the basis of which is the use of the augmentation technique that allows the generation of noised data based on bilingual dictionaries. My aim was to explore the capabilities of BDBNMT systems on different language pairs and under different initial conditions and then compare the obtained results with those of traditional neural machine translation systems.cs
dc.description.markAcs
dc.identifier.citationTIKHONOV, M. Bilingual Dictionary Based Neural Machine Translation [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other146753cs
dc.identifier.urihttp://hdl.handle.net/11012/211115
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectUmělá inteligenceen
dc.subjectzpracování přirozeného jazykaen
dc.subjectstrojový překladen
dc.subjectneurální strojový překladen
dc.subjectbilingvální slovníkyen
dc.subjectneurální strojový překlad založený na bilingválních slovnícíchen
dc.subjectlow-resource strojový překladen
dc.subjecttrénováníen
dc.subjectArtificial intelligencecs
dc.subjectnatural language processingcs
dc.subjectmachine translationcs
dc.subjectneural machine translationcs
dc.subjectbilingual dictionariescs
dc.subjectbilingual dictionary based neural machine translationcs
dc.subjectlow-resource machine translationcs
dc.subjecttrainingcs
dc.titleBilingual Dictionary Based Neural Machine Translationen
dc.title.alternativeBilingual Dictionary Based Neural Machine Translationcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-15cs
dcterms.modified2023-06-15-16:13:47cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid146753en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 20:59:14en
sync.item.modts2025.01.17 09:40:42en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.44 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
9.73 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_146753.html
Size:
8.69 KB
Format:
Hypertext Markup Language
Description:
file review_146753.html
Collections