Paralelní korpusový manažer
but.committee | prof. RNDr. Milan Češka, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) Dr. Ing. Petr Peringer (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | cs |
dc.contributor.author | Kouřil, Jan | cs |
dc.contributor.referee | Dytrych, Jaroslav | cs |
dc.date.created | 2011 | cs |
dc.description.abstract | Cílem diplomové práce bylo implementovat paralelní korpusový manažer, který umí zarovnat paralelní cizojazyčné texty a vložit je do korpusu, kde jsou poskytnuty další funkce pro jejich zpracování. Program poskytuje možnosti automatického zarovnání paralelních textů a jejich interaktivní úpravy. Tyto zarovnané texty se následně vkládají do korpusu. Program umí spravovat několik korpusů, paralelní korpus je identifikován vždy dvojicí jazyků. V korpusu je potom možno vyhledávat podle několika kategorií, zobrazovat a editovat jednotlivé výběry, lemmatizovat a morfologicky značkovat dané texty, provádět různá třídění výběrů, importovat a exportovat data, různými způsoby upravovat korpus pro další snadnou navigaci a přidávat další významy do spravovaných slovníků. Jednotlivé kapitoly popisují úvod ke korpusové problematice, teorii zarovnání paralelních textů, morfologické značkování textu a lemmatizaci, externí nástroje v programu použité, nejčastější formáty titulků a implementační řešení jednotlivých problémů. | cs |
dc.description.abstract | The goal of diploma project was to implement parallel corpus manager, which can align parallel texts in different languages and insert them into corpus, where several more processing functions are provided. Program provides possibilities of automatic text alignment and its interactive editing. These aligned texts are then inserted into corpus. Program can work with multiple corpora, parallel corpus is allways identified by a couple of languages. In corpus, there are possibilities to search by many categories, view and edit particular selections, lemmatize and morphologically tag given texts, sort selections, import and export data, in many ways edit corpus for further easy navigation and add new expressions to managed dictionaries. Particular chapters describe introduction to corpus problematics, theory of aligning parallel texts, morphological text tagging and lemmatization, external tools used in program, most common subtitle formats and implementation solution of particular problems. | en |
dc.description.mark | B | cs |
dc.identifier.citation | KOUŘIL, J. Paralelní korpusový manažer [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011. | cs |
dc.identifier.other | 42372 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/54071 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | korpus | cs |
dc.subject | manažer | cs |
dc.subject | paralelní | cs |
dc.subject | zarovnávání | cs |
dc.subject | titulky | cs |
dc.subject | lemmatizace | cs |
dc.subject | morfologie | cs |
dc.subject | hunalign | cs |
dc.subject | subdownloader | cs |
dc.subject | treetagger | cs |
dc.subject | C++ | cs |
dc.subject | Qt | cs |
dc.subject | corpus | en |
dc.subject | manager | en |
dc.subject | parallel | en |
dc.subject | alignment | en |
dc.subject | subtitles | en |
dc.subject | lemmatization | en |
dc.subject | morphology | en |
dc.subject | hunalign | en |
dc.subject | subdownloader | en |
dc.subject | treetagger | en |
dc.subject | C++ | en |
dc.subject | Qt | en |
dc.title | Paralelní korpusový manažer | cs |
dc.title.alternative | Parallel Corpus Manager | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2011-06-20 | cs |
dcterms.modified | 2020-05-09-23:41:03 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 42372 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 14:50:58 | en |
sync.item.modts | 2025.01.15 12:10:35 | en |
thesis.discipline | Inteligentní systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |