Automatické navrhování klíčových slov

Loading...
Thumbnail Image

Date

Authors

Šimara, Svatopluk

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato práce se zabývá automatickým návrhem klíčových slov českým dokumentům. Pro jejich návrh je využito čistě statistických metod. K analýze jsou použity diplomové a jiné závěrečné práce. Statistické metody jsou na vybraných dokumentech podrobně otestovány a vyhodnoceny, a pro konečný návrh klíčových slov jsou vybrány jen ty nejúspěšnější metody. Výsledky návrhu jsou na závěr porovnány s ručně přiřazenými klíčovými slovy.
This thesis deals with the automatic keywords suggestion. The suggestion is based only on the statistic methods. For the analysis are used diploma thesis and similar documents. Statistic methods are detailed tested and evaluated by using these documents.  For the final keywords suggestion ale chosen only the most successful methods. In the end, the suggested keywords are compared with the manual assigned keywords.

Description

Citation

ŠIMARA, S. Automatické navrhování klíčových slov [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) Dr. Ing. Petr Peringer (člen)

Date of acceptance

2013-06-10

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Nastiňte možnosti přímé kombinace algoritmů TF-IDF a C-value (podobně jako vznikl TF-IDF z algoritmů Term frequency a Inverse document frequency), případně vysvětlete, proč by taková kombinace byla problematická.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO