Extrakce informací z Wikipedie
Loading...
Date
Authors
Jurišica, Rudolf
ORCID
Advisor
Referee
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem práce je snížit počet neznámých odkazovaných entit ve článcích české Wikipedie. Dosáhnuto toho bylo jednak za využití pomocných, již existujících řešení, tvořených výzkumnou skupinou KNOT na VUT FIT, a dále pak vytvořením sady programů. Tyto programy se automaticky spouští každý měsíc při vydání nové verze Wikipedie. Automaticky doplní znalostní bázi o nová jména, vygeneruje jejich odvozené tvary, a upraví samotné články přímo na Wikipedii.
The goal of this thesis is to reduce the number of unknown referenced entities in Czech Wikipedia articles. This has been achieved by using some existing solutions, created by the KNOT research group at FIT BUT, and then by creating a set of programs. These programs are automatically run every month, when a new version of Wikipedia is released. They will automatically add new names to the knowledge base, generate their derived forms, and edit the articles themselves directly on Wikipedia.
The goal of this thesis is to reduce the number of unknown referenced entities in Czech Wikipedia articles. This has been achieved by using some existing solutions, created by the KNOT research group at FIT BUT, and then by creating a set of programs. These programs are automatically run every month, when a new version of Wikipedia is released. They will automatically add new names to the knowledge base, generate their derived forms, and edit the articles themselves directly on Wikipedia.
Description
Keywords
Wikipedie, extrakce informací, morfologie, analýza, Pywikibot, znalostní báze, přirozený jazyk, Wikidata, strojové učení, cizí jména, přídavná jména, Wikipedia, information extraction, morphology, analysis, Pywikibot, knowledge base, natural language, Wikidata, machine learning, foreign names, adjectives
Citation
JURIŠICA, R. Extrakce informací z Wikipedie [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Dr. Ing. Dušan Kolář (předseda)
RNDr. Marek Rychlý, Ph.D. (člen)
doc. Dr. Ing. Otto Fučík (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
Date of acceptance
2024-06-10
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení