Sémantická analýza webového obsahu
but.committee | doc. Ing. Ondřej Ryšavý, Ph.D. (předseda) doc. Ing. Jan Kořenek, Ph.D. (místopředseda) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Matěj Grégr, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: V kap. 6.2 popisujete různé testování celé aplikace. Jak probíhalo testování jejích komponent během vývoje (jednotkové testy)? Zkoušel jste také jiné možnosti stáhnutí kompletní webové stránky (např. "wget --mirror"), než Vámi implementované řešení s využitím Selenium nad prohlížečem Firefox? Proč jste se rozhodl zrovna pro složité řešení s využitím nástroje Selenium? V kap. 7.1.1 "Referenční výsledek - Ground truth" popisujete ruční segmentaci pro získání referenčních dat. Jaký je Váš a jaký je obvyklý postup dle literatury či obdobných nástrojů (v kap. není žádná citace)? Zvažoval jste možnost automatizace vyhodnocení testů? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Burget, Radek | cs |
dc.contributor.author | Hubl, Lukáš | cs |
dc.contributor.referee | Rychlý, Marek | cs |
dc.date.accessioned | 2020-07-20T19:57:53Z | |
dc.date.available | 2020-07-20T19:57:53Z | |
dc.date.created | 2020 | cs |
dc.description.abstract | Tato práce se zabývá problematikou sémantického webu, segmentace webových stránek a technologiemi, které se v těchto oblastech využívají. Dále se zaobírá modifikací jedné z metod pro segmentaci webových stránek, konkrétně metodou využívající DOM stromu, s využitím technologií z oblasti sémantického webu. Tedy navrhuje způsob segmentace webové stránky na základě sémantické analýzy obsahu jednotlivých prvků webové stránky. V rámci této práce byla také vytvořena aplikace, která demonstruje funkcionalitu navržené metody. S aplikací byly následně prováděny experimenty, jejichž zhodnocení je také součástí této práce. | cs |
dc.description.abstract | This work deals with the topics of semantic web, web page segmentation and technologies, which are used in this area. It also deals with a modification of one web page segmentation method, specifically DOM-based segmentation, using semantic web technologies. Thus, this work designs the way of web page segmentation based on semantic analysis of individual elements of the web pages content. An application that demonstrates the functionality of the designed segmentation method was also created within this work. With the implemented application, experiments were performed, whose results are also part of this work. | en |
dc.description.mark | C | cs |
dc.identifier.citation | HUBL, L. Sémantická analýza webového obsahu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020. | cs |
dc.identifier.other | 129273 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/192455 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Sémantický web | cs |
dc.subject | RDF | cs |
dc.subject | RDFS | cs |
dc.subject | RDF/XML | cs |
dc.subject | ontologie | cs |
dc.subject | DBpedia | cs |
dc.subject | DBpedia-Spotlight | cs |
dc.subject | Segmentace webových stránek | cs |
dc.subject | Python | cs |
dc.subject | lxml | cs |
dc.subject | Pyspotlight | cs |
dc.subject | Semantic web | en |
dc.subject | RDF | en |
dc.subject | RDFS | en |
dc.subject | RDF/XML | en |
dc.subject | ontology | en |
dc.subject | DBpedia | en |
dc.subject | DBpedia-Spotlight | en |
dc.subject | Web page segmentation | en |
dc.subject | Python | en |
dc.subject | lxml | en |
dc.subject | Pyspotlight | en |
dc.title | Sémantická analýza webového obsahu | cs |
dc.title.alternative | Semantic Analysis of Web Content | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2020-07-15 | cs |
dcterms.modified | 2020-07-17-14:42:11 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 129273 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.23 00:10:52 | en |
sync.item.modts | 2021.11.22 23:47:01 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 8.86 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-22669_v.pdf
- Size:
- 85.79 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-22669_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-22669_o.pdf
- Size:
- 91.76 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-22669_o.pdf
Loading...
- Name:
- review_129273.html
- Size:
- 1.43 KB
- Format:
- Hypertext Markup Language
- Description:
- review_129273.html