Kontrola konzistence informací extrahovaných z textu

Stejskal, Jakub

Kontrola konzistence informací extrahovaných z textu

but.committee	doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: V práci píšete, že jste implementoval vlastní rozpoznávač jmenných entit, protože data, která byla zpracována používaným systémem NER, byla nepřesná. Dělal jste nějaké exaktní porovnání nebo je to jen Vaše domněnka? Proč jste nepoužil nějaký standardní nástroj pro rozpoznávání jmenných entit a pustil jste se do vlastní implementace? V práci píšete, že jste vyextrahoval pouhých 435 473 vztahů pro 7 481 416 entit, přesto tvrdíte, že dosahujete pokrytí 74,46 %. Jak je to možné?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Smrž, Pavel	cs
dc.contributor.author	Stejskal, Jakub	cs
dc.contributor.referee	Otrusina, Lubomír	cs
dc.date.created	2016	cs
dc.description.abstract	Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.	cs
dc.description.abstract	This bachelor thesis is dedicated to mechanical techniques that are used in the natural language processing and information extraction from particular text. It is approaching the general methods that starting to process the raw text and it continues to the relations extraction from processed language constructs, moreover it provides options for the use of obtained relational data which can be seen for example in the project DBpedia. Another milestone of the described bachelor thesis is the design and implementation of an automated system for extracting information about entities, which do not have their own article on the English version of Wikipedia. Thesis also presents algorithms developed for the extraction of entities with their own name, the verification of the articles ‘existence of the extracted entities and finally the actual extraction of information about individual entities, which can be used during the information consistency checking. In the end, it can be seen the results and suggestions for further development of the created system.	en
dc.description.mark	E	cs
dc.identifier.citation	STEJSKAL, J. Kontrola konzistence informací extrahovaných z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.	cs
dc.identifier.other	96521	cs
dc.identifier.uri	http://hdl.handle.net/11012/62176
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	Wikipedia	cs
dc.subject	korpus	cs
dc.subject	DBpedia	cs
dc.subject	koreference	cs
dc.subject	extrakce informací	cs
dc.subject	NLP	cs
dc.subject	rozpoznávání jmenných entit	cs
dc.subject	Open Information Extraction	cs
dc.subject	kontrola konzistence	cs
dc.subject	extrakce entit	cs
dc.subject	Wikipedia	en
dc.subject	corpus	en
dc.subject	DBpedia	en
dc.subject	coreference	en
dc.subject	information extraction	en
dc.subject	NLP	en
dc.subject	named entity recognition	en
dc.subject	Open Information Extraction	en
dc.subject	consistency checking	en
dc.subject	entity extraction	en
dc.title	Kontrola konzistence informací extrahovaných z textu	cs
dc.title.alternative	Consistency Checking of Relations Extracted from Text	en
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2016-06-15	cs
dcterms.modified	2020-05-10-16:12:39	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	96521	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 18:57:20	en
sync.item.modts	2025.01.17 10:07:18	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 4 of 4

Name:: final-thesis.pdf
Size:: 787.39 KB
Format:: Adobe Portable Document Format
Description:: final-thesis.pdf

Download

Name:: Posudek-Vedouci prace-18808_v.pdf
Size:: 86.07 KB
Format:: Adobe Portable Document Format
Description:: Posudek-Vedouci prace-18808_v.pdf

Download

Name:: Posudek-Oponent prace-18808_o.pdf
Size:: 88.42 KB
Format:: Adobe Portable Document Format
Description:: Posudek-Oponent prace-18808_o.pdf

Download

Name:: review_96521.html
Size:: 1.45 KB
Format:: Hypertext Markup Language
Description:: file review_96521.html

Download

Collections

2016