Shlukování slov podle významu

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) Ing. William Steingartner, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " E ". Otázky u obhajoby: Proč jste při řešení úkolů ze Semevalu nepoužil lemmatizaci ani stemming? V kapitole 8.1 píšete, že vzhledem k počtu vytvořených modelů zde neuvádíte všechny výsledky, ale pouze výsledky pro tři vybrané modely. Můžete komisi ukázat kompletní výsledky pro všechny modely? V práci píšete, že Váš systém dosáhl úspěšnosti 93%. Můžete komisi objasnit, jak jste k tomuto číslu dospěl?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorJadrníček, Zbyněkcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2015cs
dc.description.abstractTato práce se zabývá problémem sémantické podobnosti slov v angličtině. Čtenář je nejprve informován o teorii shlukování slov podle významu, poté jsou popsány některé metody a nástroje související s tématem. V praktické části navrhneme a implementujeme systém pro výpočet sémantické podobnosti slov využívající nástroj Word2Vec, konkrétně se zaměříme na biomedicínské texty z databáze MEDLINE. Na závěr práce budeme diskutovat dosažené výsledky a předložíme několik návrhů, jak systém vylepšit.cs
dc.description.abstractThis thesis is focused on the problem of semantic similarity of words in English language. At first reader is informed about theory of word sense clustering, then there are described chosen methods and tools related to the topic. In the practical part we design and implement system for determining semantic similarity using Word2Vec tool, particularly we focus on biomedical texts of MEDLINE database. At the end of the thesis we discuss reached results and give some ideas to improve the system.en
dc.description.markEcs
dc.identifier.citationJADRNÍČEK, Z. Shlukování slov podle významu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.cs
dc.identifier.other88358cs
dc.identifier.urihttp://hdl.handle.net/11012/52223
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectbiomedicínská datacs
dc.subjectsémantická podobnostcs
dc.subjecttokenizacecs
dc.subjectvektorový prostorový modelcs
dc.subjectWord2Veccs
dc.subjectzpracování přirozeného jazykacs
dc.subjectbiomedical dataen
dc.subjectsemantic similarityen
dc.subjecttokenizationen
dc.subjectvector space modelen
dc.subjectWord2Vecen
dc.subjectnatural language processingen
dc.titleShlukování slov podle významucs
dc.title.alternativeWord Sense Clusteringen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2015-06-22cs
dcterms.modified2020-05-09-23:41:54cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid88358en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:19:03en
sync.item.modts2025.01.15 18:05:59en
thesis.disciplineBioinformatika a biocomputingcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
969.77 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-9519_v.pdf
Size:
85.53 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-9519_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-9519_o.pdf
Size:
90.65 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-9519_o.pdf
Loading...
Thumbnail Image
Name:
review_88358.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
file review_88358.html
Collections