Metody shlukování textových dat
but.committee | prof. Ing. Tomáš Hruška, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Doc. Ing. Pavel Herout, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jak obtížné by bylo rozšíření Vaší aplikace o využití ontologií? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bartík, Vladimír | cs |
dc.contributor.author | Miloš, Roman | cs |
dc.contributor.referee | Burgetová, Ivana | cs |
dc.date.accessioned | 2020-06-23T09:07:58Z | |
dc.date.available | 2020-06-23T09:07:58Z | |
dc.date.created | 2011 | cs |
dc.description.abstract | Shlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means. | cs |
dc.description.abstract | Clustering of text data is one of tasks of text mining. It divides documents into the different categories that are based on their similarities. These categories help to easily search in the documents. This thesis describes the current methods that are used for the text document clustering. From these methods we chose Simultaneous keyword identification and clustering of text documents (SKWIC). It should achieve better results than the standard clustering algorithms such as k-means. There is designed and implemented an application for this algorithm. In the end, we compare SKWIC with a k-means algorithm. | en |
dc.description.mark | C | cs |
dc.identifier.citation | MILOŠ, R. Metody shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011. | cs |
dc.identifier.other | 42358 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/54203 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Dolování v textu | cs |
dc.subject | shlukování textů | cs |
dc.subject | SKWIC | cs |
dc.subject | VSM model | cs |
dc.subject | Java | cs |
dc.subject | předzpracováni | cs |
dc.subject | Rapid Miner | cs |
dc.subject | Text mining | en |
dc.subject | text clustering | en |
dc.subject | SKWIC | en |
dc.subject | VSM model | en |
dc.subject | Java | en |
dc.subject | preprocessing | en |
dc.subject | Rapid Miner | en |
dc.title | Metody shlukování textových dat | cs |
dc.title.alternative | Textual Data Clustering Methods | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2011-06-20 | cs |
dcterms.modified | 2020-05-09-23:39:58 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 42358 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.12 22:14:17 | en |
sync.item.modts | 2021.11.12 21:38:33 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |