Kontrola konzistence informací extrahovaných z textu

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: V práci píšete, že jste implementoval vlastní rozpoznávač jmenných entit, protože data, která byla zpracována používaným systémem NER, byla nepřesná. Dělal jste nějaké exaktní porovnání nebo je to jen Vaše domněnka? Proč jste nepoužil nějaký standardní nástroj pro rozpoznávání jmenných entit a pustil jste se do vlastní implementace? V práci píšete, že jste vyextrahoval pouhých 435 473 vztahů pro 7 481 416 entit, přesto tvrdíte, že dosahujete pokrytí 74,46 %. Jak je to možné?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorStejskal, Jakubcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2016cs
dc.description.abstractTato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.cs
dc.description.abstractThis bachelor thesis is dedicated to mechanical techniques that are used in the natural language processing and information extraction from particular text. It is approaching the general methods that starting to process the raw text and it continues to the relations extraction from processed language constructs, moreover it provides options for the use of obtained relational data which can be seen for example in the project DBpedia. Another milestone of the described bachelor thesis is the design and implementation of an automated system for extracting information about entities, which do not have their own article on the English version of Wikipedia. Thesis also presents algorithms developed for the extraction of entities with their own name, the verification of the articles ‘existence of the extracted entities and finally the actual extraction of information about individual entities, which can be used during the information consistency checking. In the end, it can be seen the results and suggestions for further development of the created system.en
dc.description.markEcs
dc.identifier.citationSTEJSKAL, J. Kontrola konzistence informací extrahovaných z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96521cs
dc.identifier.urihttp://hdl.handle.net/11012/62176
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectWikipediacs
dc.subjectkorpuscs
dc.subjectDBpediacs
dc.subjectkoreferencecs
dc.subjectextrakce informacícs
dc.subjectNLPcs
dc.subjectrozpoznávání jmenných entitcs
dc.subjectOpen Information Extractioncs
dc.subjectkontrola konzistencecs
dc.subjectextrakce entitcs
dc.subjectWikipediaen
dc.subjectcorpusen
dc.subjectDBpediaen
dc.subjectcoreferenceen
dc.subjectinformation extractionen
dc.subjectNLPen
dc.subjectnamed entity recognitionen
dc.subjectOpen Information Extractionen
dc.subjectconsistency checkingen
dc.subjectentity extractionen
dc.titleKontrola konzistence informací extrahovaných z textucs
dc.title.alternativeConsistency Checking of Relations Extracted from Texten
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2016-06-15cs
dcterms.modified2020-05-10-16:12:39cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96521en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 18:57:20en
sync.item.modts2025.01.17 10:07:18en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
787.39 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18808_v.pdf
Size:
86.07 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18808_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18808_o.pdf
Size:
88.42 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18808_o.pdf
Loading...
Thumbnail Image
Name:
review_96521.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_96521.html
Collections