Systém slovenské morfologie založený na vzorech

Loading...
Thumbnail Image

Date

Authors

Klocok, Andrej

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cieľom tejto práce je zoznámenie sa s metódami morfologickej analýzy, reprezentáciou dát morfologických slovníkov, vytvorením systému technických vzorov pre flektívnu morfológiu slovenčiny. Z tohto systému je odvodený morfologický analyzátor, ktorý vstupné slová lematizuje, určí ich vzor a morfologickú značku, nástroj pre porovnávanie a vyhodnocovanie stemerov, ktorý hodnotí stemery na základe derivačného slovníka, nástroj na rekonštrukciu diakritiky, ktorý vznikol ako pomocný nástroj. V posledných kapitolách práce sú jednotlivé nástroje zhodnotené, analyzátor je porovnaný s dostupnou alternatívou, pomocou nástroja na hodnotenie stemerov sú porovnané dve implementácie slovenských stemerov a je naznačený ďalší vývoj jednotlivých nástrojov
Theaimofthisthesisistogetacquaintedwithmethodsofmorphologicalanalysis,representation of data of morphological dictionaries, creation of system based on technical patterns for flective morphology of Slovak language. From this system is derived a morphological analyzer, which lemmatizes input words, determines their pattern and a morphological tag, a tool for comparison and evaluation of stemmers, which evaluates stemmers based on a derivative dictionary, a tool for reconstruction of diacritics, which was created as an auxiliary tool. In the last chapters of thesis, individual tools are assessed, morphological analyzer is compared with available alternative,two implementations of Slovak stemmers are evaluated by the tool for stemmer evaluation and the further development of tools is indicated.

Description

Citation

KLOCOK, A. Systém slovenské morfologie založený na vzorech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) Ing. Marcela Zachariášová, Ph.D. (člen)

Date of acceptance

2017-06-14

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Proč jste v práci nepřešel na lepší řešení pro uložení morfologického slovníku než je databáze SQLite, když opakovaně popisujte, jak je toto řešení nevhodné z hlediska rychlosti a paměťových nároků? Provedl jste vyhodnocení, zda počet pravidel stemmeru naměřený Vaším nástrojem odpovídá realitě?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO