Metody shlukování textových dat

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Doc. Ing. Pavel Herout, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jak obtížné by bylo rozšíření Vaší aplikace o využití ontologií?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorMiloš, Romancs
dc.contributor.refereeBurgetová, Ivanacs
dc.date.accessioned2020-06-23T09:07:58Z
dc.date.available2020-06-23T09:07:58Z
dc.date.created2011cs
dc.description.abstractShlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means.cs
dc.description.abstractClustering of text data is one of tasks of text mining. It divides documents into the different categories that are based on their similarities. These categories help to easily search in the documents. This thesis describes the current methods that are used for the text document clustering. From these methods we chose Simultaneous keyword identification and clustering of text documents (SKWIC). It should achieve better results than the standard clustering algorithms such as k-means. There is designed and implemented an application for this algorithm. In the end, we compare SKWIC with a k-means algorithm.en
dc.description.markCcs
dc.identifier.citationMILOŠ, R. Metody shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.cs
dc.identifier.other42358cs
dc.identifier.urihttp://hdl.handle.net/11012/54203
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDolování v textucs
dc.subjectshlukování textůcs
dc.subjectSKWICcs
dc.subjectVSM modelcs
dc.subjectJavacs
dc.subjectpředzpracovánics
dc.subjectRapid Minercs
dc.subjectText miningen
dc.subjecttext clusteringen
dc.subjectSKWICen
dc.subjectVSM modelen
dc.subjectJavaen
dc.subjectpreprocessingen
dc.subjectRapid Mineren
dc.titleMetody shlukování textových datcs
dc.title.alternativeTextual Data Clustering Methodsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-20cs
dcterms.modified2020-05-09-23:39:58cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid42358en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 22:14:17en
sync.item.modts2021.11.12 21:38:33en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.19 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_42358.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
review_42358.html
Collections