Paralelní korpusový manažer

but.committeeprof. RNDr. Milan Češka, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorKouřil, Jancs
dc.contributor.refereeDytrych, Jaroslavcs
dc.date.created2011cs
dc.description.abstractCílem diplomové práce bylo implementovat paralelní korpusový manažer, který umí zarovnat paralelní cizojazyčné texty a vložit je do korpusu, kde jsou poskytnuty další funkce pro jejich zpracování. Program poskytuje možnosti automatického zarovnání paralelních textů a jejich interaktivní úpravy. Tyto zarovnané texty se následně vkládají do korpusu. Program umí spravovat několik korpusů, paralelní korpus je identifikován vždy dvojicí jazyků. V korpusu je potom možno vyhledávat podle několika kategorií, zobrazovat a editovat jednotlivé výběry, lemmatizovat a morfologicky značkovat dané texty, provádět různá třídění výběrů, importovat a exportovat data, různými způsoby upravovat korpus pro další snadnou navigaci a přidávat další významy do spravovaných slovníků. Jednotlivé kapitoly popisují úvod ke korpusové problematice, teorii zarovnání paralelních textů, morfologické značkování textu a lemmatizaci, externí nástroje v programu použité, nejčastější formáty titulků a implementační řešení jednotlivých problémů.cs
dc.description.abstractThe goal of diploma project was to implement parallel corpus manager, which can align parallel texts in different languages and insert them into corpus, where several more processing functions are provided. Program provides possibilities of automatic text alignment and its interactive editing. These aligned texts are then inserted into corpus. Program can work with multiple corpora, parallel corpus is allways identified by a couple of languages. In corpus, there are possibilities to search by many categories, view and edit particular selections, lemmatize and morphologically tag given texts, sort selections, import and export data, in many ways edit corpus for further easy navigation and add new expressions to managed dictionaries. Particular chapters describe introduction to corpus problematics, theory of aligning parallel texts, morphological text tagging and lemmatization, external tools used in program, most common subtitle formats and implementation solution of particular problems.en
dc.description.markBcs
dc.identifier.citationKOUŘIL, J. Paralelní korpusový manažer [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.cs
dc.identifier.other42372cs
dc.identifier.urihttp://hdl.handle.net/11012/54071
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectkorpuscs
dc.subjectmanažercs
dc.subjectparalelnícs
dc.subjectzarovnávánícs
dc.subjecttitulkycs
dc.subjectlemmatizacecs
dc.subjectmorfologiecs
dc.subjecthunaligncs
dc.subjectsubdownloadercs
dc.subjecttreetaggercs
dc.subjectC++cs
dc.subjectQtcs
dc.subjectcorpusen
dc.subjectmanageren
dc.subjectparallelen
dc.subjectalignmenten
dc.subjectsubtitlesen
dc.subjectlemmatizationen
dc.subjectmorphologyen
dc.subjecthunalignen
dc.subjectsubdownloaderen
dc.subjecttreetaggeren
dc.subjectC++en
dc.subjectQten
dc.titleParalelní korpusový manažercs
dc.title.alternativeParallel Corpus Manageren
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-20cs
dcterms.modified2020-05-09-23:41:03cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid42372en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:50:58en
sync.item.modts2025.01.15 12:10:35en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
861.17 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_42372.html
Size:
1.42 KB
Format:
Hypertext Markup Language
Description:
file review_42372.html
Collections