Nástroj pro automatické kategorizování webových stránek
but.committee | prof. Ing. Miroslav Švéda, CSc. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (místopředseda) doc. Dr. Ing. Otto Fučík (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Prof. Ing. Pavol Návrat, Ph.D. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Jakým způsobem jsou zpracovány části webové stránky psané např. v JavaScriptu? Vysvětlete význam histogramů v práci na str. 37. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Malčík, Dominik | en |
dc.contributor.author | Lat, Radek | en |
dc.contributor.referee | Bartík, Vladimír | en |
dc.date.created | 2014 | cs |
dc.description.abstract | Tato diplomová práce popisuje návrh a implementaci nástroje pro automatickou kategorizaci webových stránek. Cílem nástroje je aby byl schopen se z ukázkových webových stránek naučit, jak každá kategorie vypadá. Poté by měl nástroj zvládnout přiřadit naučené kategorie k dříve nespatřeným webovým stránkám. Nástroj by měl podporovat více kategorií a jazyků. Pro vývoj nástroje byly použity pokročilé techniky strojového učení, detekce jazyků a dolování dat. Nástroj je založen na open source knihovnách a je napsán v jazyce Python 3.3. | en |
dc.description.abstract | This master's thesis describes the design and implementation of a tool for automated web pages categorization. The goal of this tool is to be able to learn from given sample web pages how each category looks like. Later, it should manage to assign these categories to previously unseen web pages. The tool should support multiple categories and languages. Advanced machine learning, language detection, and data mining techniques were used for the development of this tool. It is based on open source libraries and it is written in Python 3.3. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | LAT, R. Nástroj pro automatické kategorizování webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014. | cs |
dc.identifier.other | 79713 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/53297 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | strojové učení | en |
dc.subject | SVM | en |
dc.subject | crawler | en |
dc.subject | robot | en |
dc.subject | detekce jazyků | en |
dc.subject | kategorizace | en |
dc.subject | python | en |
dc.subject | web | en |
dc.subject | machine learning | cs |
dc.subject | SVM | cs |
dc.subject | crawler | cs |
dc.subject | language detection | cs |
dc.subject | categorization | cs |
dc.subject | python | cs |
dc.subject | web | cs |
dc.title | Nástroj pro automatické kategorizování webových stránek | en |
dc.title.alternative | Automated Web Page Categorization Tool | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2014-06-25 | cs |
dcterms.modified | 2020-05-10-16:11:31 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 79713 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:17:29 | en |
sync.item.modts | 2025.01.15 21:30:21 | en |
thesis.discipline | Počítačové sítě a komunikace | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |