Inteligentní extrakce dat ve webovém prohlížeči
but.committee | doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Dr. Ing. Petr Peringer (člen) Ing. Josef Strnadel, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Existuje podobný systém, se kterým by bylo možné vaše výsledky porovnat? Popište, jak si představujete, že byste rozšířil vaše řešení o metody strojového učení, jak zmiňujete v závěru. V čem spočívá inteligence z názvu práce? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Burget, Radek | cs |
dc.contributor.author | Maštera, František | cs |
dc.contributor.referee | Bartík, Vladimír | cs |
dc.date.created | 2021 | cs |
dc.description.abstract | Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje. | cs |
dc.description.abstract | The goal of this thesis is to extract data from web pages without the knowledge of their internal structure. The point is to recognize the structure using an algorithm and a given input information about the content that the user wants to extract. The structure analysis is then followed by the content extraction itself. An average success rate of over 80% was achieved on selected sets of websites. The resulting algorithm represents a new approach to data extraction and can be deployed in the real world or can be a part of further development. | en |
dc.description.mark | A | cs |
dc.identifier.citation | MAŠTERA, F. Inteligentní extrakce dat ve webovém prohlížeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021. | cs |
dc.identifier.other | 136478 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/198926 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Zpracování dokumentu | cs |
dc.subject | extrakce dat | cs |
dc.subject | rozpoznávání struktur dokumentu | cs |
dc.subject | web | cs |
dc.subject | TypeScript | cs |
dc.subject | Puppeteer | cs |
dc.subject | Document processing | en |
dc.subject | data extraction | en |
dc.subject | document structure recognition | en |
dc.subject | web | en |
dc.subject | TypeScript | en |
dc.subject | Puppeteer | en |
dc.title | Inteligentní extrakce dat ve webovém prohlížeči | cs |
dc.title.alternative | Intelligent Data Scraping in a Web Browser | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2021-06-16 | cs |
dcterms.modified | 2022-08-24-21:52:01 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 136478 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:33:56 | en |
sync.item.modts | 2025.01.17 10:20:02 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.67 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23533_v.pdf
- Size:
- 85.57 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-23533_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23533_o.pdf
- Size:
- 88.29 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-23533_o.pdf
Loading...
- Name:
- review_136478.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_136478.html