Metody shlukování textových dat

Miloš, Roman

Metody shlukování textových dat

but.committee	prof. Ing. Tomáš Hruška, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Doc. Ing. Pavel Herout, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jak obtížné by bylo rozšíření Vaší aplikace o využití ontologií?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Bartík, Vladimír	cs
dc.contributor.author	Miloš, Roman	cs
dc.contributor.referee	Burgetová, Ivana	cs
dc.date.created	2011	cs
dc.description.abstract	Shlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means.	cs
dc.description.abstract	Clustering of text data is one of tasks of text mining. It divides documents into the different categories that are based on their similarities. These categories help to easily search in the documents. This thesis describes the current methods that are used for the text document clustering. From these methods we chose Simultaneous keyword identification and clustering of text documents (SKWIC). It should achieve better results than the standard clustering algorithms such as k-means. There is designed and implemented an application for this algorithm. In the end, we compare SKWIC with a k-means algorithm.	en
dc.description.mark	C	cs
dc.identifier.citation	MILOŠ, R. Metody shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.	cs
dc.identifier.other	42358	cs
dc.identifier.uri	http://hdl.handle.net/11012/54203
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	Dolování v textu	cs
dc.subject	shlukování textů	cs
dc.subject	SKWIC	cs
dc.subject	VSM model	cs
dc.subject	Java	cs
dc.subject	předzpracováni	cs
dc.subject	Rapid Miner	cs
dc.subject	Text mining	en
dc.subject	text clustering	en
dc.subject	SKWIC	en
dc.subject	VSM model	en
dc.subject	Java	en
dc.subject	preprocessing	en
dc.subject	Rapid Miner	en
dc.title	Metody shlukování textových dat	cs
dc.title.alternative	Textual Data Clustering Methods	en
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.dateAccepted	2011-06-20	cs
dcterms.modified	2020-05-09-23:39:58	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	42358	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.26 14:52:34	en
sync.item.modts	2025.01.15 15:07:38	en
thesis.discipline	Informační systémy	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 1.19 MB
Format:: Adobe Portable Document Format
Description:: final-thesis.pdf

Download

Name:: review_42358.html
Size:: 1.43 KB
Format:: Hypertext Markup Language
Description:: file review_42358.html

Download

Collections

2011