Automatická tvorba paralelního korpusu z titulků k filmům

Loading...
Thumbnail Image

Date

Authors

Straňák, Marek

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Táto práca sa zaoberá tvorbou paralelného korpusu, ktorého zdrojom sú filmové titulky. Konkrétne sa jedná o zarovnanie českých a anglických viet s využitím slovníkov a morfologických analyzátorov, prípadne zarovnanie titulkov v iných jazykoch na základe časovania jednotlivých komentárov. Práca taktiež pojednáva o obecnej problematike paralelných korpusov.
This work is about the creation of parallel corpus, where movie subtitles is main source. In particulary, it is about alignment czech and english sentences using dictionaries and morphologic analyzers or alignment talks of subtitles in other languages using timing of talks. The work give basic information about parallel corpus.

Description

Citation

STRAŇÁK, M. Automatická tvorba paralelního korpusu z titulků k filmům [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

Date of acceptance

Defence

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO