Určování typů entit na základě extrakce informací z Wikipedie

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Jaroslav Zendulka, CSc. (místopředseda) Ing. František Grézl, Ph.D. (člen) doc. Ing. Zdeněk Kotásek, CSc. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: V kapitole 8 "Výsledky" bych očekával podrobnější srovnání Vašeho systému s DBpedií. Můžete komisi ukázat výsledky tohoto srovnání na několika typech entit. Jaké články správně identifikoval Váš systém oproti DBpedii? Jaké články správně identifikovala DBpedie oproti Vašemu systému? Jaké jsou výhody Vašeho systému oproti DBpedii?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorRusiňák, Petrcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2018cs
dc.description.abstractCílem této práce je identifikovat typy článků na Wikipedii (např. rozlišit články o osobách od článků o sportovních utkáních), přičemž tento systém by měl být použitelný pro libovolný typ extrahované entity. Vstupem pro tento systém je seznam několika vzorových článků patřících do hledané entity a seznam několika článků nepatřících do této entity. Na základě těchto seznamů budou vygenerovány příznaky, které lze použít k nalezení všech článků patřící do této entity. Tyto příznaky mohou být založeny jak na základě strukturovaných informací na Wikipedii (např. šablony, kategorie), tak i na základě analýzy přirozeného textu v první větě článku, kde bude nalezeno definiční podstatné jméno vystihující entitu daného článku. Tento systém podporuje extrakci česky a anglicky psaných článků a je rozšířitelný pro podporu dalších jazyků.cs
dc.description.abstractThis paper presents a system for identifying entity types of articles on Wikipedia (e.g. people or sports events) that can be used for identifaction of any arbitrary entity. The~input files for this system are a list of several pages that belong to this entity and a list of several pages that do not belong to this entity. These lists will be used to generate features that can be used for generation of the list of all pages belonging to this entity. The fatures can be based on both structured information on Wikipedia such as templates and categories and non-structured informations found by the analysis of natural text in the first sentence of the article where a defining noun that represents what the article is about will be found. This system support pages written in Czech and English and can be extended to support other languages.en
dc.description.markCcs
dc.identifier.citationRUSIŇÁK, P. Určování typů entit na základě extrakce informací z Wikipedie [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.cs
dc.identifier.other114800cs
dc.identifier.urihttp://hdl.handle.net/11012/85189
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectWikipediecs
dc.subjecturčování typů entitcs
dc.subjectasociační analýzacs
dc.subjectWikipediaen
dc.subjectidentifying entity typesen
dc.subjectassociation analysisen
dc.titleUrčování typů entit na základě extrakce informací z Wikipediecs
dc.title.alternativeIdentifying Entity Types Based on Information Extraction from Wikipediaen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2018-06-14cs
dcterms.modified2020-05-10-16:13:23cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid114800en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:08:03en
sync.item.modts2025.01.17 11:26:30en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.04 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-20995_v.pdf
Size:
86.25 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-20995_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-20995_o.pdf
Size:
89.12 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-20995_o.pdf
Loading...
Thumbnail Image
Name:
review_114800.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_114800.html
Collections