Algoritmy pro shlukování textových dat

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen)cs
but.defenceCo je to ontologická báze a k čemu se v oblasti zpracování obrazu používá? - Na základě ontologie se vytváří významové informace. Objasnete význam Davies-Bouldin indexu a jak se používá pro analýzu kvality clusterování. - Čím menší DB tím lepší výsledek shlukování. Jakých parametrů jste využíval při shlukové analýze? Popište Kohonenovu síť.cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKarásek, Jancs
dc.contributor.authorSedláček, Josefcs
dc.contributor.refereeBurget, Radimcs
dc.date.created2011cs
dc.description.abstractTato diplomová práce se zabývá problematikou dolování textových dat. Je zde popsána teorie potřebná ke shlukování textových dokumentů a také algoritmy, které se při shlukování využívají. Podle této teorie je pak vytvořena aplikace pro shlukování textových dat. Aplikace je vytvořena v programovacím jazyku Java a obsahuje tři metody používané při shlukování. Uživatel si tak sám může vybrat metodu, podle které chce kolekci dokumentů shlukovat. Implementované metody jsou K medoids, BiSec K medoids a SOM (self organization map). Součástí aplikace je také vytvoření validační množiny, pomocí které jsou algoritmy testovány. V závěru jsou pak algoritmy porovnány podle dosažených výsledků.cs
dc.description.abstractThe thesis deals with text mining. It describes the theory of text document clustering as well as algorithms used for clustering. This theory serves as a basis for developing an application for clustering text data. The application is developed in Java programming language and contains three methods used for clustering. The user can choose which method will be used for clustering the collection of documents. The implemented methods are K medoids, BiSec K medoids, and SOM (self-organization maps). The application also includes a validation set, which was specially created for the diploma thesis and it is used for testing the algorithms. Finally, the algorithms are compared according to obtained results.en
dc.description.markAcs
dc.identifier.citationSEDLÁČEK, J. Algoritmy pro shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.cs
dc.identifier.other35533cs
dc.identifier.urihttp://hdl.handle.net/11012/1363
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdata miningcs
dc.subjectshlukovánics
dc.subjectkolekce dokumentucs
dc.subjecttermcs
dc.subjectshlukovací algoritmycs
dc.subjectSOM(self organization map)cs
dc.subjectK meanscs
dc.subjectK medoidscs
dc.subjectBiSec K meanscs
dc.subjectBiSec K medoidscs
dc.subjectdata miningen
dc.subjectclusteringen
dc.subjectdocument collectionen
dc.subjecttermen
dc.subjectclustering algorithmsen
dc.subjectSOM (selforganization map)en
dc.subjectK meansen
dc.subjectK medoidsen
dc.subjectBiSec K meansen
dc.subjectBiSec K medoidsen
dc.titleAlgoritmy pro shlukování textových datcs
dc.title.alternativeText data clustering algorithmsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-08cs
dcterms.modified2011-07-15-10:45:03cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid35533en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 11:24:22en
sync.item.modts2025.01.17 13:16:00en
thesis.disciplineTelekomunikační a informační technikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.05 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_35533.html
Size:
6.85 KB
Format:
Hypertext Markup Language
Description:
file review_35533.html
Collections