Shlukování slov podle významu

but.committeedoc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) doc. Ing. Lukáš Burget, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Proč jste zvolil velikost vektoru 300 a velikost kontextového okna 5 pro metodu CBOW, resp. 10 pro Skip-gram? Zkoušel jste s těmito hodnotami nějak experimentovat? Pokud by tyto hodnoty byly vyšší, dosažené výsledky by byly pravděpodobně lepší. Jaké rychlosti jste dosahoval při trénování modelu? Spouštěl jste trénování paralelně? Jaká byla rychlost výpočtu podobných slov?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorHaljuk, Petrcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2015cs
dc.description.abstractTato bakalářská práce se zabývá sémantickou podobností slov. Popisuje návrh a implementaci systému, který vyhledává nejpodobnější slova a určuje sémantickou podobnost vět. Systém využívá model Word2Vec z knihovny GenSim . Vztahy mezi slovy se model učí analýzou korpusu CommonCrawl .cs
dc.description.abstractThis Bachelor's thesis deals with the semantic similarity of words . It describes the design and the implementation of a system, which searches for the most similar words and measures the semantic similarity of words . The system uses the Word2Vec model from GenSim library . It learns the relations among words from CommonCrawl corpus .en
dc.description.markCcs
dc.identifier.citationHALJUK, P. Shlukování slov podle významu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.cs
dc.identifier.other88731cs
dc.identifier.urihttp://hdl.handle.net/11012/52560
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectzpracování přirozeného jazykacs
dc.subjectsémantická podobnostcs
dc.subjectGenSimcs
dc.subjectWord2Veccs
dc.subjectnatural language processingen
dc.subjectsemantic similarityen
dc.subjectGenSimen
dc.subjectWord2Vecen
dc.titleShlukování slov podle významucs
dc.title.alternativeWord Sense Clusteringen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2015-06-18cs
dcterms.modified2020-05-10-16:12:09cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid88731en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 18:52:34en
sync.item.modts2025.01.15 19:13:02en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
443.3 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-17717_v.pdf
Size:
85.43 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-17717_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-17717_o.pdf
Size:
88.61 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-17717_o.pdf
Loading...
Thumbnail Image
Name:
review_88731.html
Size:
1.42 KB
Format:
Hypertext Markup Language
Description:
file review_88731.html
Collections