Similarity Search in Document Collections

Loading...
Thumbnail Image

Date

Authors

Jordanov, Dimitar Dimitrov

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Hlavním cílem této práce je odhadnout výkonnost volně šířeni balík  Sémantický Vektory a třída MoreLikeThis z balíku Apache Lucene. Tato práce nabízí porovnání těchto dvou přístupů a zavádí metody, které mohou vést ke zlepšení kvality vyhledávání.
The main objective of this work is to estimate the efficiency of the available software for similarity search in document collections and on two in particular, Semantic Vectors and Lecene's class MoreLikeThis. The paper provides a comparison of those two approaches and introduces methods that can lead to improving the quality of the results generated by a search.

Description

Citation

JORDANOV, D. Similarity Search in Document Collections [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Počítačové systémy a sítě

Comittee

Date of acceptance

Defence

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO