Vyhledávání informací v textových datech

Loading...
Thumbnail Image

Date

Authors

Tkadlčík, Luboš

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato práce se zabývá problematikou dolování textových dat a vyhledávání informací. Práce popisuje nejčastější metody reprezentace textových dokumentů a strategie vyhledávání. Cílem práce je navržení a implementace aplikace, která bude provádět vyhledávání informací pomocí vektorového modelu. Aplikace realizuje tři způsoby výpočtu podobnosti: kosinovou míru, Jaccardův koeficient a Diceho koeficient. Výsledky dosažené pomocí těchto vztahů jsou porovnány a vyhodnoceny. Je nastíněno další pokračování projektu.
This thesis researches the issue of text data mining and information retrieval. It describes the most common representations of text documents and retrieval strategies. The aim of this thesis is design and implementation of application, which realises information retrieval via vector space model. The application implements three different ways of similarity calculation: cosine measure, the Jaccard coefficient and the Dice coefficient. Achieved results are assessed. Possible continuance of the project is outlined.

Description

Citation

TKADLČÍK, L. Vyhledávání informací v textových datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Ing. Jiří Kunovský, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen)

Date of acceptance

2013-06-13

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Mohl byste blíže popsat použité testovací korpusy? Jaký je jejich původní účel? Byly publikovány nějaké srovnatelné experimentální výsledky nad těmito korpusy?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO