Nalezení slovních kořenů v češtině

Loading...
Thumbnail Image

Date

Authors

Hellebrand, David

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cílem této diplomové práce je vytvořit pro český jazyk lemmatizační algoritmus založený na gramatických pravidlech. Práce obsahuje popis problematiky lemmatizace a několika různých lemmatizačních algoritmů. Dále jsou popsány základy gramatiky českého jazyka a také jazyka Snowball, ve kterém budou navržené postupy implementovány. Hlavní část tvoří popis implementace lemmatizačního algoritmu.
The goal of this master's thesis is to develop stemming algorithm for czech language based on grammatical rules. You can find a description of stemming process and a comparsion of stemming algorithms in this project. The basics of czech grammar and Snowball language are also described here. The main part of this thesis concerns the implementation of the new czech stemming algorithm.

Description

Citation

HELLEBRAND, D. Nalezení slovních kořenů v češtině [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační systémy

Comittee

doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Lukáš Sekanina, Ph.D. (místopředseda) doc. Ing. Přemysl Kršek, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) RNDr. Marek Rychlý, Ph.D. (člen)

Date of acceptance

2010-06-21

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Popište, jak si představujete funkci hybridního stemmeru, o němž se zmiňujete v záměru. Zkuste odhadnout, jak často by musel přistupovat do slovníku.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO