Statistický strojový překlad mezi češtinou a slovenštinou

Loading...
Thumbnail Image

Date

Authors

Astaloš, Lukáš

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cílem téhle práce je navrhnout, implementovat a vyhodnotit úspěšnost vytvořeného systému pro překlad českých textů do slovenštiny. Popisuje teoretické základy statistického strojového překladu a pak samotnou fázi návrhu a vývoje systému. Zvolenou strategií bylo použít jeden rozsáhlý paralelní korpus v kombinaci s jazykovým modelem poskytovaným místním jazykovědným ústavem pro vytvoření překladového modelu založeném na frázích. Pro tenhle účel byl použit nástroj Moses. Experimentálně byl otestován také slovníkový překlad neznámých slov použitím stemmování. Úspěšnost systému byla vyhodnocena metrikou BLEU, přičemž dosažené výsledky byly porovnatelné s jinými systémy.
The aim of this thesis is to design, implement and evaluate the translation system capable of translating texts from Czech to Slovak language. It describes theoretical foundations of statistical machine translation and then the phase of design and development of system. The chosen strategy was to build phrase-based translation model using one large parallel corpus in combination with language model from local institute of linguistics. The statistical machine translation Moses was used to achieve this goal. The vocabulary translation of unknown words using stemming was proposed and tested. Precision of build system was evaluated with BLEU score and it achieved comparable results with other systems.

Description

Citation

ASTALOŠ, L. Statistický strojový překlad mezi češtinou a slovenštinou [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (místopředseda) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)

Date of acceptance

2013-06-11

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Jaký vliv má procentuální rozdělení datové sady na trénovací, validační a testovací část na výslednou úspěšnost překladače? Proč jste zvolil daný poměr?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO