Kontrola konzistence informací extrahovaných z textu
but.committee | doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: V práci píšete, že jste implementoval vlastní rozpoznávač jmenných entit, protože data, která byla zpracována používaným systémem NER, byla nepřesná. Dělal jste nějaké exaktní porovnání nebo je to jen Vaše domněnka? Proč jste nepoužil nějaký standardní nástroj pro rozpoznávání jmenných entit a pustil jste se do vlastní implementace? V práci píšete, že jste vyextrahoval pouhých 435 473 vztahů pro 7 481 416 entit, přesto tvrdíte, že dosahujete pokrytí 74,46 %. Jak je to možné? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | cs |
dc.contributor.author | Stejskal, Jakub | cs |
dc.contributor.referee | Otrusina, Lubomír | cs |
dc.date.created | 2016 | cs |
dc.description.abstract | Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému. | cs |
dc.description.abstract | This bachelor thesis is dedicated to mechanical techniques that are used in the natural language processing and information extraction from particular text. It is approaching the general methods that starting to process the raw text and it continues to the relations extraction from processed language constructs, moreover it provides options for the use of obtained relational data which can be seen for example in the project DBpedia. Another milestone of the described bachelor thesis is the design and implementation of an automated system for extracting information about entities, which do not have their own article on the English version of Wikipedia. Thesis also presents algorithms developed for the extraction of entities with their own name, the verification of the articles ‘existence of the extracted entities and finally the actual extraction of information about individual entities, which can be used during the information consistency checking. In the end, it can be seen the results and suggestions for further development of the created system. | en |
dc.description.mark | E | cs |
dc.identifier.citation | STEJSKAL, J. Kontrola konzistence informací extrahovaných z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016. | cs |
dc.identifier.other | 96521 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/62176 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Wikipedia | cs |
dc.subject | korpus | cs |
dc.subject | DBpedia | cs |
dc.subject | koreference | cs |
dc.subject | extrakce informací | cs |
dc.subject | NLP | cs |
dc.subject | rozpoznávání jmenných entit | cs |
dc.subject | Open Information Extraction | cs |
dc.subject | kontrola konzistence | cs |
dc.subject | extrakce entit | cs |
dc.subject | Wikipedia | en |
dc.subject | corpus | en |
dc.subject | DBpedia | en |
dc.subject | coreference | en |
dc.subject | information extraction | en |
dc.subject | NLP | en |
dc.subject | named entity recognition | en |
dc.subject | Open Information Extraction | en |
dc.subject | consistency checking | en |
dc.subject | entity extraction | en |
dc.title | Kontrola konzistence informací extrahovaných z textu | cs |
dc.title.alternative | Consistency Checking of Relations Extracted from Text | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2016-06-15 | cs |
dcterms.modified | 2020-05-10-16:12:39 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 96521 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 18:57:20 | en |
sync.item.modts | 2025.01.17 10:07:18 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 787.39 KB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-18808_v.pdf
- Size:
- 86.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-18808_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-18808_o.pdf
- Size:
- 88.42 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-18808_o.pdf
Loading...
- Name:
- review_96521.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_96521.html