Extrakce vztahů z textu

Loading...
Thumbnail Image

Date

Authors

Královič, Kristián

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Táto bakalárska práca sa zameriava na extrakciu sémantických vzťahov medzi pomenovanými entitami v prirodzenom texte pomocou učenia s malým počtom pomocných príkladov. V teoretickej časti práce sú predstavené metódy reprezentácie prirodzeného jazyka pomocou hustých vektorov a rozpoznávanie pomenovaných entít. Ďalej sú opísané prístupy k extrakcii sémantických vzťahov založené na hlbokom učení. Teoretická časť zahŕňa aj popis učenia s malým počtom trénovacích príkladov v kontexte extrakcie sémantických vzťahov. V implementačnej časti bol navrhnutý systém pre extrakciu sémantických vzťahov z textu. Systém ku klasifikácii vzťahov využíva párové klasifikátory založené na predtrénovaných jazykových modeloch typu transformers. Pre potreby práce boli natrénované modely ELECTRA-PAIR, RoBERTa-PAIR a BERT-PAIR. V experimentálnej časti práce sú tieto modely vyhodnotené nad rôznymi dátovými sadami. Experimentálna časť zároveň zahrňuje aj experimenty zamerané na klasifikáciu zložitejších sémantických vzťahov.
This bachelor thesis focuses on the extraction of semantic relations between named entities in natural text using learning with a small number of supporting examples. The theoretical part of the thesis introduces methods for natural language representation using dense vectors and named entity recognition. Next, deep learning based approaches for semantic relation extraction are described. The theoretical part also includes a description of learning with a small number of training examples in the context of semantic relation extraction In the implementation part, a system for extracting semantic relations from text has been proposed. The system uses pairwise classifiers based on pre-trained language models like transformers to classify the relations. For the purpose of this work, the ELECTRA-PAIR, RoBERTa-PAIR and BERT-PAIR models were trained. In the experimental part of the thesis, these models are evaluated over different datasets. The experimental part also includes experiments aimed at classifying more complex semantic relations.

Description

Citation

KRÁLOVIČ, K. Extrakce vztahů z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

Informační technologie

Comittee

doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (člen) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)

Date of acceptance

2023-06-12

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na oponentem položené otázky rozhodla práci hodnotit stupněm ...

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO