Implementace algoritmu pro vizuální segmentaci www stránek

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) doc. Dr. Ing. Petr Hanáček (místopředseda) doc. RNDr. Jitka Kreslíková, CSc. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. Ing. Pavol Návrat, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Které vlastnosti použitého vykreslovacího jádra (nebo jejich nepřítomnost) považujete za nejvíce omezující pro výsledky segmentace?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorZelený, Jancs
dc.contributor.authorPopela, Tomášcs
dc.contributor.refereeBurget, Radekcs
dc.date.created2012cs
dc.description.abstractSegmentace WWW stránek, neboli dělení stránky na různé sémantické bloky, je jedna z disciplín techniky extrakce informací. Diplomová práce se zabývá metodou Vision-based Page Segmentation - VIPS, která spočívá v dělení stránky na základě vizuálních vlastností prvků stránky. Metoda je uvedena v kontextu dalších význačných segmentačních postupů. V práci jsou popsány a na příkladech ukázány nejdležitější kroky, ze kterých se tato metodika skládá. Pro metodu VIPS je nezbytná spolupráce s vykreslovacím jádrem WWW stránek, z důvodu získání DOM stromu stránky. V práci jsou představeny a popsány čtyři nejvýznačnější enginy pro programovací jazyk Java. Výstupem této práce je implementace algoritmu VIPS právě v jazyce Java s využitím jádra CSSBox. Dále je představena původní implementace algoritmu z laboratoří firmy Microsoft. Popsány jsou jednotlivé etapy vývoje knihovny realizující metodu VIPS a vlastního přístupu k jejímu řešení. Výsledek práce je v závěru demonstrován při segmentaci několika internetových stránek.cs
dc.description.abstractSegmentation of WWW pages or page division on di erent semantics blocks is one of the disciplines of information extraction. Master's thesis deals with Vision-based Page Segmentation - VIPS method, which consist in division based on visual properties of page's elements. The method is given in context of other prominent segmentation procedures. In this work, the key steps, that this method consist of are shown and described on examples. For VIPS method it is necessary to cooperate with WWW pages rendering engine in order to obtain Document Object Model of page. The paper presents and describes four most important engines for Java programming language. The output of this work is implementation of VIPS algorithm just in Java language with usage of CSSBox core. The original algorithm implementation from Microsoft's labs is presented. The di erent development stages of library implementing VIPS method and my approach to it's solution are described. In the end of this work the work's outcome is demonstrated on several pages segmentation.en
dc.description.markAcs
dc.identifier.citationPOPELA, T. Implementace algoritmu pro vizuální segmentaci www stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other79109cs
dc.identifier.urihttp://hdl.handle.net/11012/53735
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectVision-based Page Segmentationcs
dc.subjectJavacs
dc.subjectLinuxcs
dc.subjectWWWcs
dc.subjectSegmentacecs
dc.subjectCSSBoxcs
dc.subjectDocument Object Modelcs
dc.subjectVision-based Page Segmentationen
dc.subjectJavaen
dc.subjectLinuxen
dc.subjectWWWen
dc.subjectSegmentationen
dc.subjectCSSBoxen
dc.subjectDocument Object Modelen
dc.titleImplementace algoritmu pro vizuální segmentaci www stránekcs
dc.title.alternativeImplementation of Algorithm for Visual Web Page Segmentationen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2012-06-18cs
dcterms.modified2020-05-09-23:43:27cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79109en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:13:16en
sync.item.modts2025.01.15 14:29:16en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
6.04 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79109.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_79109.html
Collections