Vyhledávání informací v textových datech
but.committee | doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Ing. Jiří Kunovský, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Mohl byste blíže popsat použité testovací korpusy? Jaký je jejich původní účel? Byly publikovány nějaké srovnatelné experimentální výsledky nad těmito korpusy? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bartík, Vladimír | cs |
dc.contributor.author | Tkadlčík, Luboš | cs |
dc.contributor.referee | Burget, Radek | cs |
dc.date.created | 2013 | cs |
dc.description.abstract | Tato práce se zabývá problematikou dolování textových dat a vyhledávání informací. Práce popisuje nejčastější metody reprezentace textových dokumentů a strategie vyhledávání. Cílem práce je navržení a implementace aplikace, která bude provádět vyhledávání informací pomocí vektorového modelu. Aplikace realizuje tři způsoby výpočtu podobnosti: kosinovou míru, Jaccardův koeficient a Diceho koeficient. Výsledky dosažené pomocí těchto vztahů jsou porovnány a vyhodnoceny. Je nastíněno další pokračování projektu. | cs |
dc.description.abstract | This thesis researches the issue of text data mining and information retrieval. It describes the most common representations of text documents and retrieval strategies. The aim of this thesis is design and implementation of application, which realises information retrieval via vector space model. The application implements three different ways of similarity calculation: cosine measure, the Jaccard coefficient and the Dice coefficient. Achieved results are assessed. Possible continuance of the project is outlined. | en |
dc.description.mark | B | cs |
dc.identifier.citation | TKADLČÍK, L. Vyhledávání informací v textových datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013. | cs |
dc.identifier.other | 78909 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/52883 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | vyhledávání informací | cs |
dc.subject | vektorový model | cs |
dc.subject | relevance | cs |
dc.subject | dolování textových dat | cs |
dc.subject | kosinová míra | cs |
dc.subject | Jaccardův koeficient | cs |
dc.subject | Diceho koeficient | cs |
dc.subject | information retrieval | en |
dc.subject | vector space model | en |
dc.subject | relevance | en |
dc.subject | text data mining | en |
dc.subject | Cosine measure | en |
dc.subject | Jaccard coefficient | en |
dc.subject | Dice coefficient | en |
dc.title | Vyhledávání informací v textových datech | cs |
dc.title.alternative | Information Retrieval in Text Data | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2013-06-13 | cs |
dcterms.modified | 2020-05-09-23:43:16 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 78909 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 17:57:32 | en |
sync.item.modts | 2025.01.15 14:50:00 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |