Automatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informací
but.committee | doc. Dr. Ing. Dušan Kolář (předseda) RNDr. Marek Rychlý, Ph.D. (člen) doc. Dr. Ing. Otto Fučík (člen) Ing. František Grézl, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. | cs |
but.jazyk | slovenština (Slovak) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | sk |
dc.contributor.author | Hložek, Matej | sk |
dc.contributor.referee | Otrusina, Lubomír | sk |
dc.date.created | 2024 | cs |
dc.description.abstract | Táto bakalárska práca sa zaoberá vytvorením systému pre automatickú extrakciu dát z článkov v anglickom jazyku na internetovej encyklopédií Wikipédia. Z textu prirodzeného jazyka a z takzvaných infoboxov jednotlivých článkov na Wikipédií sú extrahované rôzne informácie podľa triedy, ktorá je určená textovým klasifikátorom. Výsledkom tohto systému je vedomostná základňa obsahujúca všetky vyextrahované dáta a klasifikáciu získaných Wikipédia článkov. Súčasťou systému je aj extraktor článkov, ktorý z takzvaného wikidump súboru vyextrahuje infoboxy a úvodné odseky jednotlivých článkov. | sk |
dc.description.abstract | This bachelor's thesis is focused on creation of system for automatic extraction of data from articles in English language from internet encyclopedia site Wikipedia. Depending on class given by text classifier, different types of information are extracted from natural language text and from so called infoboxes of individual articles from Wikipedia. Final product of this system is a knowledge base containing all extracted data and classified type. A notable part of this system is an article extractor that extracts infoboxes and first paragraphs of articles from so called wikidump file. | en |
dc.description.mark | E | cs |
dc.identifier.citation | HLOŽEK, M. Automatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informací [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 156454 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/246606 | |
dc.language.iso | sk | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Wikipédia | sk |
dc.subject | Wikidata | sk |
dc.subject | spracovanie prirodzeného jazyku | sk |
dc.subject | extrakcia dát | sk |
dc.subject | strojové učenie | sk |
dc.subject | klasifikácia textu | sk |
dc.subject | neurónová sieť | sk |
dc.subject | python | sk |
dc.subject | spacy | sk |
dc.subject | Wikipedia | en |
dc.subject | Wikidata | en |
dc.subject | natural language processing | en |
dc.subject | data extraction | en |
dc.subject | machine learning | en |
dc.subject | text classification | en |
dc.subject | neuron network | en |
dc.subject | python | en |
dc.subject | spacy | en |
dc.title | Automatické doplňování a opravy Wikidat a Wikipedie na základě extrakce informací | sk |
dc.title.alternative | Automatic Additions and Corrections of Wikidata and Wikipedia Based on Information Extraction | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-10 | cs |
dcterms.modified | 2024-06-17-08:45:38 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 156454 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:03 | en |
sync.item.modts | 2025.01.15 13:52:10 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |