Sémantická podobnost textů

but.committeeprof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: Na straně 13 uvádíte příklad výpočtu podobnosti dvou vektorů pomocí kosinové podobnosti. Na závěr příkladu tvrdíte, že je nutné výslednou hodnotu odečíst od čísla 1, aby byl výsledek v intervalu <0;1>. Tohle tvrzení není pravdivé. Můžete prosím komisi předložit správnou verzi výpočtu? Proč jste zvolil počet dimenzí pro LDA a LSA 18, když se v praxi používají hodnoty v řádu stovek. Jak si vysvětlujete, že Vám stačilo pouhých 18 dimenzí k dosažení nejlepšího výsledku?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorBradáč, Václavcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2015cs
dc.description.abstractTato práce se zabývá problematikou určování sémantické podobnosti textů se zaměřením na škálovatelnost. Součástí zpracování je teoretický přehled nástrojů pro implementaci systému na testovaných datech. Testovaný korpus obsahuje odborné články v anglickém jazyce. Cílem práce je tyto články analyzovat, modifikovat pro snadnější analýzu jejich sémantické obdoby. Jedním z nejdůležitějších využitých nástrojů je reprezentace dat ve vektorovém prostoru.cs
dc.description.abstractThis paper deals with the determination of semantic similarity texts, focusing on scalability. Part of treatment is a theoretical overview of the tools to implement the system on test data. Tested corpus contains expert articles in the English language. The aim is to analyze these articles, modified to facilitate the analysis of their semantic analogues. One of the most utilized tools is a representation of data in a vector space model.en
dc.description.markEcs
dc.identifier.citationBRADÁČ, V. Sémantická podobnost textů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.cs
dc.identifier.other88743cs
dc.identifier.urihttp://hdl.handle.net/11012/52420
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSémantická podobnostcs
dc.subjectTF-IDFcs
dc.subjectLatentní sémantická analýzacs
dc.subjectLatentní sémantická indexacecs
dc.subjectSingulární rozkladcs
dc.subjectLatentní Direchletova alokacecs
dc.subjectPythoncs
dc.subjectGensimcs
dc.subjectPHPcs
dc.subjectElasticsearchcs
dc.subjectMoreLikeThiscs
dc.subjectSemantic similarityen
dc.subjectTF-IDFen
dc.subjectLatent semantic analysisen
dc.subjectLatent semantic indexingen
dc.subjectSingular value decompositionen
dc.subjectLatent Direchletova allocationen
dc.subjectPythonen
dc.subjectGensimen
dc.subjectPHPen
dc.subjectElasticsearchen
dc.subjectMoreLikeThisen
dc.titleSémantická podobnost textůcs
dc.title.alternativeSemantic Similarity of Textsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2015-06-16cs
dcterms.modified2020-05-10-16:12:10cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid88743en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 18:50:05en
sync.item.modts2025.01.15 13:59:40en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.36 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-17736_v.pdf
Size:
85.75 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-17736_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-17736_o.pdf
Size:
89.45 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-17736_o.pdf
Loading...
Thumbnail Image
Name:
review_88743.html
Size:
1.42 KB
Format:
Hypertext Markup Language
Description:
file review_88743.html
Collections