Automatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informací

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) RNDr. Marek Rychlý, Ph.D. (člen) doc. Dr. Ing. Otto Fučík (člen) Ing. František Grézl, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelsk
dc.contributor.authorHložek, Matejsk
dc.contributor.refereeOtrusina, Lubomírsk
dc.date.created2024cs
dc.description.abstractTáto bakalárska práca sa zaoberá vytvorením systému pre automatickú extrakciu dát z článkov v anglickom jazyku na internetovej encyklopédií Wikipédia. Z textu prirodzeného jazyka a z takzvaných infoboxov jednotlivých článkov na Wikipédií sú extrahované rôzne informácie podľa triedy, ktorá je určená textovým klasifikátorom. Výsledkom tohto systému je vedomostná základňa obsahujúca všetky vyextrahované dáta a klasifikáciu získaných Wikipédia článkov. Súčasťou systému je aj extraktor článkov, ktorý z takzvaného wikidump súboru vyextrahuje infoboxy a úvodné odseky jednotlivých článkov.sk
dc.description.abstractThis bachelor's thesis is focused on creation of system for automatic extraction of data from articles in English language from internet encyclopedia site Wikipedia. Depending on class given by text classifier, different types of information are extracted from natural language text and from so called infoboxes of individual articles from Wikipedia. Final product of this system is a knowledge base containing all extracted data and classified type. A notable part of this system is an article extractor that extracts infoboxes and first paragraphs of articles from so called wikidump file.en
dc.description.markEcs
dc.identifier.citationHLOŽEK, M. Automatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informací [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other156454cs
dc.identifier.urihttp://hdl.handle.net/11012/246606
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectWikipédiask
dc.subjectWikidatask
dc.subjectspracovanie prirodzeného jazykusk
dc.subjectextrakcia dátsk
dc.subjectstrojové učeniesk
dc.subjectklasifikácia textusk
dc.subjectneurónová sieťsk
dc.subjectpythonsk
dc.subjectspacysk
dc.subjectWikipediaen
dc.subjectWikidataen
dc.subjectnatural language processingen
dc.subjectdata extractionen
dc.subjectmachine learningen
dc.subjecttext classificationen
dc.subjectneuron networken
dc.subjectpythonen
dc.subjectspacyen
dc.titleAutomatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informacísk
dc.title.alternativeAutomatic Additions and Corrections of Wikidata and Wikipedia Based on Information Extractionen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2024-06-10cs
dcterms.modified2024-06-17-08:45:38cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid156454en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 21:01:03en
sync.item.modts2025.01.15 13:52:10en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.37 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_156454.html
Size:
11.38 KB
Format:
Hypertext Markup Language
Description:
file review_156454.html
Collections