Extrakce dat z dynamických WWW stránek

Loading...
Thumbnail Image

Date

Authors

Puna, Petr

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato práce obsahuje stručný přehled technologií používaných pro prezentaci a získání dat na WWW a popisuje vybrané nástroje pro extrakci dat z webových stránek. Práce dále navrhuje nový nástroj pro získání stránek, generovaných na základě vyplnění webových formulářů, který umožňuje uživateli definovat data na takovýchto webových stránkách a dokáže takto definovaná data extrahovat a nabídnout ve formátu XML, použitelném pro další strojové zpracování.
This work contains a brief overview of technologies for representation and obtaining data on WWW and describes selected web data extraction tools. The work designs a new tool for obtaining pages generated by filling in web forms, which allows its user to define data on such web pages and which can extract those data and offer it in a XML format suitable for future machine processing.

Description

Citation

PUNA, P. Extrakce dat z dynamických WWW stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační systémy

Comittee

Date of acceptance

Defence

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO