Sémantická podobnost textů
but.committee | prof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: Na straně 13 uvádíte příklad výpočtu podobnosti dvou vektorů pomocí kosinové podobnosti. Na závěr příkladu tvrdíte, že je nutné výslednou hodnotu odečíst od čísla 1, aby byl výsledek v intervalu <0;1>. Tohle tvrzení není pravdivé. Můžete prosím komisi předložit správnou verzi výpočtu? Proč jste zvolil počet dimenzí pro LDA a LSA 18, když se v praxi používají hodnoty v řádu stovek. Jak si vysvětlujete, že Vám stačilo pouhých 18 dimenzí k dosažení nejlepšího výsledku? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | cs |
dc.contributor.author | Bradáč, Václav | cs |
dc.contributor.referee | Otrusina, Lubomír | cs |
dc.date.created | 2015 | cs |
dc.description.abstract | Tato práce se zabývá problematikou určování sémantické podobnosti textů se zaměřením na škálovatelnost. Součástí zpracování je teoretický přehled nástrojů pro implementaci systému na testovaných datech. Testovaný korpus obsahuje odborné články v anglickém jazyce. Cílem práce je tyto články analyzovat, modifikovat pro snadnější analýzu jejich sémantické obdoby. Jedním z nejdůležitějších využitých nástrojů je reprezentace dat ve vektorovém prostoru. | cs |
dc.description.abstract | This paper deals with the determination of semantic similarity texts, focusing on scalability. Part of treatment is a theoretical overview of the tools to implement the system on test data. Tested corpus contains expert articles in the English language. The aim is to analyze these articles, modified to facilitate the analysis of their semantic analogues. One of the most utilized tools is a representation of data in a vector space model. | en |
dc.description.mark | E | cs |
dc.identifier.citation | BRADÁČ, V. Sémantická podobnost textů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015. | cs |
dc.identifier.other | 88743 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/52420 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Sémantická podobnost | cs |
dc.subject | TF-IDF | cs |
dc.subject | Latentní sémantická analýza | cs |
dc.subject | Latentní sémantická indexace | cs |
dc.subject | Singulární rozklad | cs |
dc.subject | Latentní Direchletova alokace | cs |
dc.subject | Python | cs |
dc.subject | Gensim | cs |
dc.subject | PHP | cs |
dc.subject | Elasticsearch | cs |
dc.subject | MoreLikeThis | cs |
dc.subject | Semantic similarity | en |
dc.subject | TF-IDF | en |
dc.subject | Latent semantic analysis | en |
dc.subject | Latent semantic indexing | en |
dc.subject | Singular value decomposition | en |
dc.subject | Latent Direchletova allocation | en |
dc.subject | Python | en |
dc.subject | Gensim | en |
dc.subject | PHP | en |
dc.subject | Elasticsearch | en |
dc.subject | MoreLikeThis | en |
dc.title | Sémantická podobnost textů | cs |
dc.title.alternative | Semantic Similarity of Texts | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2015-06-16 | cs |
dcterms.modified | 2020-05-10-16:12:10 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 88743 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 18:50:05 | en |
sync.item.modts | 2025.01.15 13:59:40 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.36 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-17736_v.pdf
- Size:
- 85.75 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-17736_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-17736_o.pdf
- Size:
- 89.45 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-17736_o.pdf
Loading...
- Name:
- review_88743.html
- Size:
- 1.42 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_88743.html