Nové metody segmentace webových stránek

Loading...
Thumbnail Image

Date

Authors

Malaník, Michal

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cílem této práce je představit novou metodu segmentace webových stránek založenou na analýze vizuálních vlastností webových dokumentů. Metoda vychází z velmi populárního segmentačního algoritmu VIPS (Vision Based Page Segmentation Algorithm), který se snaží na segmentovaný dokument nahlížet stejně, jako ho ve výsledku vidí jeho uživatel, tedy prostřednictvím vizuální reprezentace v internetovém prohlížeči. Oproti algoritmu VIPS jsou však u metody představené v této práci brány v úvahu optimalizace pro moderní webové stránky, především poté pro dokumenty vytvořené v jazyce HTML verze 5. Práce se rovněž zabývá implementací navržené metody pomocí rámce FITLayout.
The aim of this work is to introduce a new vision based web page segmentation method. This method is based on very popular VIPS segmentation algorithm, which is trying to represent the segmented web document in the same way as it is perceived by a user using a web browser. Compared to the VIPS algorithm, there are some optimizations for modern websites in our method, especially for documents created in the HTML 5 language. We also deal with the implementaion of the proposed method using the FITLayout framework.

Description

Citation

MALANÍK, M. Nové metody segmentace webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační systémy

Comittee

doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)

Date of acceptance

2016-06-21

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně A. Otázky u obhajoby: Charakterizujte stránky, pro které váš segmentační algoritmus nepracuje zcela správně a případná řešení těchto problémů.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO