Efektivnost strojového překladu
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práce hodnotí strojový překlad z hlediska problémů kterým čelí, popisuje nejčastější metody a přístupy a s pomocí praktických ukázkek překladů, hodnotí, kvality a možností využití. Problémem jsou v první řadě odlišnosti mezi jazyky, které mohou mít odlišnou flexi, mluvnické kategorie nebo slovosled, a jsou tedy vyžadovány metody, které by tyto morfologické, gramatické a syntaktické odlišnosti zohledňovali. Další problémy jsou na úrovni sémantiky, kde musí překladače správně identifikovat význam slova a zvolit vhodný překlad. Ovšem možnosti porozumění významu jakožto i zohledňování kontextu jsou u počítačů omezené, stejně tak jako větší překladatelská rozhodnutí ohledně celého textu. Úspěšné řešení těchto problémů by vyžadovalo kompletní umělou inteligenci, která však v současnosti není k dispozici. Nejvyšší úrovně umělé inteligence dosahují patrně překladače, používající neuronové sítě, což je nejmodernější metoda strojového překladu, kterou již používají i některé běžně dostupné internetové překladače. Praktická ukázka na několika typech textů, přeložených z Angličtiny do Češtiny a naopak pomocí Google Translate ukázala, že strojový překlad pomocí neuronových sítí se velice úspěšně vypořádává s množstvím jazykových odlišností a dovede překládat termíny a delší fráze, stále ovšem produkuje množství chyb často bez předvídatelné příčiny a jeho chování je celkově nekonzistentí a citlivé na změny. Doposud tedy neexistuje universální systém, který by byl schopen plně automatického překladu vysoké kvality. Aplikace strojového překladu je vždy omezena buď sníženou kvalitou textu, nebo nutností návrhu systému pouze pro specifický účel a omezené pole působnosti. Strojový překlad tedy může zvyšovat efektivitu překladu jako takového pří nutnosti lidského zapojení, ale v dohledné době nenahradí lidské překladatele.
The thesis considers machine translation(MT) in terms of difficulties it deals with, describes the most common methods and, with practical examples of MT, evaluates its quality and possible applications. In the first place, the MT has to deal with differences between languages, which can have different inflection, grammatical categories and syntax. Methods to deal with morphological, grammatical and syntactical differences are therefore required. Another problem is on the level of semantics; the MT systems must successfully identify meaning of words and choose appropriate translation. However, the computers have only limited capability in understanding of the meaning and considering context, as well as in making greater decisions about the whole text. To successfully deal with all problems of translation, a complete artificial inteligence would be required, which is not yet available. The most advanced in terms of AI seems to be the neural machine translation, which is the most modern method already used by online translators. The practical example of translation of several types of texts from English to Czech (and from CS to EN) with Google Translate shows that NMT can cope with many language differences and it can often successfully translate terminology and longer phrases, but it still produces a large number of mistakes, reason for which cannot be observed directly, and its behavior is inconsistent and sensitive to any change. To this day, there is still no universal system that would be able to produce Fully Automatic High-Quality Translation. MT application is restricted either by reduced quality of the output or by designing MT system only for specific field or purpose. MT can overall improve translation efficiency, while human involvement is required, but it will not replace human translators in the near future.
The thesis considers machine translation(MT) in terms of difficulties it deals with, describes the most common methods and, with practical examples of MT, evaluates its quality and possible applications. In the first place, the MT has to deal with differences between languages, which can have different inflection, grammatical categories and syntax. Methods to deal with morphological, grammatical and syntactical differences are therefore required. Another problem is on the level of semantics; the MT systems must successfully identify meaning of words and choose appropriate translation. However, the computers have only limited capability in understanding of the meaning and considering context, as well as in making greater decisions about the whole text. To successfully deal with all problems of translation, a complete artificial inteligence would be required, which is not yet available. The most advanced in terms of AI seems to be the neural machine translation, which is the most modern method already used by online translators. The practical example of translation of several types of texts from English to Czech (and from CS to EN) with Google Translate shows that NMT can cope with many language differences and it can often successfully translate terminology and longer phrases, but it still produces a large number of mistakes, reason for which cannot be observed directly, and its behavior is inconsistent and sensitive to any change. To this day, there is still no universal system that would be able to produce Fully Automatic High-Quality Translation. MT application is restricted either by reduced quality of the output or by designing MT system only for specific field or purpose. MT can overall improve translation efficiency, while human involvement is required, but it will not replace human translators in the near future.
Description
Keywords
neuronový strojový překlad, pravidlový strojový překlad, statistický strojový překlad, umělá inteligence, neuronové sítě, hodnocení strojového překladu, neural machine translation, classical machine translation, statistical machine translation, artificial intelligence, neural networks, machine translation evaluation
Citation
KVAPIL, L. Efektivnost strojového překladu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Angličtina v elektrotechnice a informatice
Comittee
doc. PhDr. Milena Krhutová, Ph.D. (předseda)
Mgr. Bc. Dagmar Šťastná (místopředseda)
Mgr. Pavel Sedláček (člen)
Mgr. Jaromír Haupt, Ph.D. (člen)
Mgr. Miroslav Kotásek, Ph.D. (člen)
Mgr. Magdalena Šedrlová (člen)
prof. Ing. Vladislav Musil, CSc. (člen)
PhDr. Milan Smutný, Ph.D. (člen)
prof. Ing. Jaroslav Boušek, CSc. (člen)
Date of acceptance
2017-06-21
Defence
Student přednesl prezentaci své BP.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení