Porovnávání dokumentů na základě barevného schématu

Loading...
Thumbnail Image

Date

Authors

Duchoň, Matúš

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato práce pojednává o porovnávání webových dokumentů na základe jejich barevného schématu. Zaměřujeme se na problematiku získávání barevné schémy, pro ktorou byly navrženy dvě metody spracování dokumentu, obě využívajíci knihovnu CSSBox [1]. Dále je také představen návrh normalizace dokumentu, která získavání barevného schématu předchází. Její hlavním cílem je identifikovat a zjednotit možný promněnlivý obsah zkoumaného dokumentu, aby neovlivňoval výsledky nežádoucím spůsobem. Řeší se také implementace těchto navrhovaných postupů do knihovny, která byla v závěru práce testována na vzorové sade webových dokumentů.
This paper proposes the method of web document comparison based on the color scheme. It focuses on issues of color scheme retrieving. There are suggested two methods that are using CSSBox library [1]. Also, a suggestion for a document normalization is introduced. Its main goal is to identify and unite possible dynamic content of given document which could negatively affect results of retrieving. Suggested procedures are implemented in the library. It was tested on a set of web documents.

Description

Citation

DUCHOŇ, M. Porovnávání dokumentů na základě barevného schématu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Zdeněk Kotásek, CSc. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen)

Date of acceptance

2012-06-11

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B (velmi dobře). Otázky u obhajoby: V kapitole Normalizace dokumentu popisujete metodu, která do značné míry využívá značek jazyka HTML5. V jakém procentu dokumentů z testovací množiny byly tyto značky využity? Jak ovlivní výsledek normalizace, pokud tyto značky nejsou použity?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO