Extrakce informací ze slabě strukturovaného textu

Minárik, Matej

Extrakce informací ze slabě strukturovaného textu

but.committee	doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Miroslav Balík, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně A. Otázky u obhajoby: Jak náročné by bylo upravit vaši metodu pro extrakci informací z dokumentů o jiných tématech? Jakým způsobem by mohly být použity zmíněné klasifikační metody pro úlohu extrakce informací?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Burget, Radek	cs
dc.contributor.author	Minárik, Matej	cs
dc.contributor.referee	Bartík, Vladimír	cs
dc.date.created	2016	cs
dc.description.abstract	V dnešnej dobe sa stretávame s pojmom Web 2.0, ktorý predstavuje web dokumentov. Dokumenty na webe sú dostupné vo väčšine prípadov v neštruktúrovanej, alebo čiastočne štruktúrovanej podobe. Pre lepšie a jednoduchšie vyhľadávanie však potrebujú mať vyhľadávače dáta v štruktúrovanej podobe. Práca sa zameriava na analýzu spôsobov extrakcie informácií z neštruktúrovaného textu. V práci analyzujeme jednak použitie rôznych typov klasifikátorov, ale aj metód, ktoré nepotrebujú mať k dispozícii anotované dáta na trénovanie interných modelov. Ďalej navrhujeme metódu na extrakciu terapeutických indikácií a účinných látok z príbalových letákov liekov.	cs
dc.description.abstract	Nowadays we are speaking about Web 2.0, which means the web of documents rather than the web of data. Documents are mostly unstructured, or just partially structured, but search engines need data in structured form in order to provide better search results. The process of extracting structured data from partially structured documents is the main goal of this work. In this work we are analyzing information extraction methods, namely classification methods, which need annotated training data, in order to create their inner model. We also analyze methods, which do not need training. These methods are initialized with a few data examples we are interested in extracting. We propose an extraction method in order to extract therapeutic indications and active substances from medical information sheets.	en
dc.description.mark	A	cs
dc.identifier.citation	MINÁRIK, M. Extrakce informací ze slabě strukturovaného textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.	cs
dc.identifier.other	96303	cs
dc.identifier.uri	http://hdl.handle.net/11012/61882
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	extrakcia informácií	cs
dc.subject	strojové učenie	cs
dc.subject	príbalové letáky liekov	cs
dc.subject	information extraction	en
dc.subject	machine learning	en
dc.subject	medication information sheets	en
dc.title	Extrakce informací ze slabě strukturovaného textu	cs
dc.title.alternative	Information Extraction from Loosely Structured Text	en
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.dateAccepted	2016-06-23	cs
dcterms.modified	2020-05-10-16:12:22	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	96303	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.26 15:22:29	en
sync.item.modts	2025.01.17 12:54:50	en
thesis.discipline	Informační systémy	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 4 of 4

Name:: final-thesis.pdf
Size:: 1.05 MB
Format:: Adobe Portable Document Format
Description:: final-thesis.pdf

Download

Name:: Posudek-Vedouci prace-18103_v.pdf
Size:: 86.22 KB
Format:: Adobe Portable Document Format
Description:: Posudek-Vedouci prace-18103_v.pdf

Download

Name:: Posudek-Oponent prace-18103_o.pdf
Size:: 88.86 KB
Format:: Adobe Portable Document Format
Description:: Posudek-Oponent prace-18103_o.pdf

Download

Name:: review_96303.html
Size:: 1.45 KB
Format:: Hypertext Markup Language
Description:: file review_96303.html

Download

Collections

2016