Nástroj pro extrakci textu z www stránky

Loading...
Thumbnail Image

Date

Authors

Pohlídal, Michal

Mark

E

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato bakalářská práce se zabývá možnostmi extrakce textu z webových stránek a jeho následným uložením do databázového systému MySQL. Jsou zde popsány jazyky a nástroje pro tvorbu webových stránek a vysvětleny rozdíly v extrakci textu z jednotlivých typů stránek. Dále je v práci zmíněn návrh a implementace vytvořeného nástroje v jazyce Java a jeho srovnání s ostatními dostupnými nástroji.
This bachelor thesis deals with the possibilities of text extraction from web pages and its subsequent deposit in the MySQL database system. Next, languages and tools for creating web pages are described and the differences in the extraction of text from the various types of pages are explained. Design and implementation of tool in Java language and its comparison with other available tools are also mentioned.

Description

Citation

POHLÍDAL, M. Nástroj pro extrakci textu z www stránky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

Date of acceptance

Defence

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO