Extrakce informací ze slabě strukturovaného textu
but.committee | doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Miroslav Balík, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně A. Otázky u obhajoby: Jak náročné by bylo upravit vaši metodu pro extrakci informací z dokumentů o jiných tématech? Jakým způsobem by mohly být použity zmíněné klasifikační metody pro úlohu extrakce informací? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Burget, Radek | cs |
dc.contributor.author | Minárik, Matej | cs |
dc.contributor.referee | Bartík, Vladimír | cs |
dc.date.created | 2016 | cs |
dc.description.abstract | V dnešnej dobe sa stretávame s pojmom Web 2.0, ktorý predstavuje web dokumentov. Dokumenty na webe sú dostupné vo väčšine prípadov v neštruktúrovanej, alebo čiastočne štruktúrovanej podobe. Pre lepšie a jednoduchšie vyhľadávanie však potrebujú mať vyhľadávače dáta v štruktúrovanej podobe. Práca sa zameriava na analýzu spôsobov extrakcie informácií z neštruktúrovaného textu. V práci analyzujeme jednak použitie rôznych typov klasifikátorov, ale aj metód, ktoré nepotrebujú mať k dispozícii anotované dáta na trénovanie interných modelov. Ďalej navrhujeme metódu na extrakciu terapeutických indikácií a účinných látok z príbalových letákov liekov. | cs |
dc.description.abstract | Nowadays we are speaking about Web 2.0, which means the web of documents rather than the web of data. Documents are mostly unstructured, or just partially structured, but search engines need data in structured form in order to provide better search results. The process of extracting structured data from partially structured documents is the main goal of this work. In this work we are analyzing information extraction methods, namely classification methods, which need annotated training data, in order to create their inner model. We also analyze methods, which do not need training. These methods are initialized with a few data examples we are interested in extracting. We propose an extraction method in order to extract therapeutic indications and active substances from medical information sheets. | en |
dc.description.mark | A | cs |
dc.identifier.citation | MINÁRIK, M. Extrakce informací ze slabě strukturovaného textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016. | cs |
dc.identifier.other | 96303 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/61882 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | extrakcia informácií | cs |
dc.subject | strojové učenie | cs |
dc.subject | príbalové letáky liekov | cs |
dc.subject | information extraction | en |
dc.subject | machine learning | en |
dc.subject | medication information sheets | en |
dc.title | Extrakce informací ze slabě strukturovaného textu | cs |
dc.title.alternative | Information Extraction from Loosely Structured Text | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2016-06-23 | cs |
dcterms.modified | 2020-05-10-16:12:22 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 96303 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:22:29 | en |
sync.item.modts | 2025.01.17 12:54:50 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.05 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-18103_v.pdf
- Size:
- 86.22 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-18103_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-18103_o.pdf
- Size:
- 88.86 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-18103_o.pdf
Loading...
- Name:
- review_96303.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_96303.html