Aplikace pro parsování a analýzu obsahu webových stránek

Loading...
Thumbnail Image

Date

Authors

Odstrčil, Štěpán

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato bakalářská práce se zabývá parsováním textu z HTML stránek a jejich analýze a rozboru. Byly použity techniky z Natural Language Processingu, neboli Zpracování Přirozeného Jazyka. Byla napsána knihovna v programovacím jazyce Python, za použitím nejnovějších technologií, postupů a knihoven. Byl zpracován popis těchto knihoven a tříd, jejich použití a příklady. Aplikace dále byla otestována unit testy. Aplikace obsahuje GUI (Graphical User Interface) pro snadnější používání a demonstraci funkcionalit.
This bachelor’s thesis is dealing with parsing of text in HTML pages and its analysis. Practices from Natural Language Processing were used. There were written libraries (or packages) in programming language Python, with use of modern practices, techniques and libraries. The usages and examples of these libraries and classes were made. All these libraries were tested using Unit tests. Application contains GUI (Graphical User Interface) for wasier usefulness and demonstration of functionality.

Description

Citation

ODSTRČIL, Š. Aplikace pro parsování a analýzu obsahu webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Teleinformatika

Comittee

prof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. Petr Sysel, Ph.D. (místopředseda) Ing. Radim Číž, Ph.D. (člen) Ing. Martin Štůsek, Ph.D. (člen) Ing. Ondřej Šmirg, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen)

Date of acceptance

2019-06-12

Defence

Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Jaký je rozdíl mezi pojmem neurální a neuronový?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO