Metody hledání k-nejbližších sousedů
Loading...
Date
Authors
Cigánik, Marek
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
V práci je popsán základní koncept algoritmu K-nejbližších sousedů a jeho vazba s lidským pojetím podobnosti objektů. Jsou rozvedeny pojmy a klíčové myšlenky jako vzdálenostní funkce nebo prokletí dimenzionality. Práce zahrnuje detailní popis metod KD-Strom, Kulovitý strom, Locality-Sensitive Hashing, Strom náhodných projekcí a rodiny algoritmů založené na grafu nejbližších sousedů. Ke každé metodě je poskytnuto vysvětlení ideje s vizualizacemi, pseudokódy a asymptotickými složitostmi. Metody byly podrobeny experimentům a byly měřeny základní i pokročilejší metriky, ze kterých byly vyhodnoceny případy vhodnosti pro jednotlivé metody.
The thesis describes the basic concept of the K-nearest neighbors algorithm and its connection with the human concept of object similarity. Concepts and key ideas such as the distance function or the curse of dimensionality are elaborated. The work includes a detailed description of the methods KD-Tree, Spherical Tree, Locality-Sensitive Hashing, Random Projection Tree and families of algorithms based on the nearest neighbor graph. An explanation of the idea with visualizations, pseudocodes and asymptotic complexities is provided for each method. The methods were subjected to experiments and both basic and more advanced metrics were measured and appropriate use cases for individual methods were evaluated.
The thesis describes the basic concept of the K-nearest neighbors algorithm and its connection with the human concept of object similarity. Concepts and key ideas such as the distance function or the curse of dimensionality are elaborated. The work includes a detailed description of the methods KD-Tree, Spherical Tree, Locality-Sensitive Hashing, Random Projection Tree and families of algorithms based on the nearest neighbor graph. An explanation of the idea with visualizations, pseudocodes and asymptotic complexities is provided for each method. The methods were subjected to experiments and both basic and more advanced metrics were measured and appropriate use cases for individual methods were evaluated.
Description
Keywords
K-nejbližších sousedů , KD-Strom , Kulovitý Strom , Strom náhodných projekcí , KNN graf , HNSW , NNDescent , Locality-Sensitive Hashing , KNN , LSH , K-nearest neighbors , KD-Tree , Ball-Tree , RPTree , KNNGraph , HNSW , NNDescent , Locality-Sensitive Hasning , KNN , LSH
Citation
CIGÁNIK, M. Metody hledání k-nejbližších sousedů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Softwarové inženýrství
Comittee
prof. Ing. Tomáš Hruška, CSc. (předseda)
doc. RNDr. Jitka Kreslíková, CSc. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
doc. RNDr. Pavel Smrž, Ph.D. (člen)
Ing. Libor Polčák, Ph.D. (člen)
doc. Ing. Michal Bidlo, Ph.D. (člen)
Date of acceptance
2023-06-21
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
