Nástroj pro automatické kategorizování webových stránek

but.committeeprof. Ing. Miroslav Švéda, CSc. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (místopředseda) doc. Dr. Ing. Otto Fučík (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Prof. Ing. Pavol Návrat, Ph.D. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Jakým způsobem jsou zpracovány části webové stránky psané např. v JavaScriptu? Vysvětlete význam histogramů v práci na str. 37.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMalčík, Dominiken
dc.contributor.authorLat, Radeken
dc.contributor.refereeBartík, Vladimíren
dc.date.created2014cs
dc.description.abstractTato diplomová práce popisuje návrh a implementaci nástroje pro automatickou kategorizaci webových stránek. Cílem nástroje je aby byl schopen se z ukázkových webových stránek naučit, jak každá kategorie vypadá. Poté by měl nástroj zvládnout přiřadit naučené kategorie k dříve nespatřeným webovým stránkám. Nástroj by měl podporovat více kategorií a jazyků. Pro vývoj nástroje byly použity pokročilé techniky strojového učení, detekce jazyků a dolování dat. Nástroj je založen na open source knihovnách a je napsán v jazyce Python 3.3.en
dc.description.abstractThis master's thesis describes the design and implementation of a tool for automated web pages categorization. The goal of this tool is to be able to learn from given sample web pages how each category looks like. Later, it should manage to assign these categories to previously unseen web pages. The tool should support multiple categories and languages. Advanced machine learning, language detection, and data mining techniques were used for the development of this tool. It is based on open source libraries and it is written in Python 3.3.cs
dc.description.markAcs
dc.identifier.citationLAT, R. Nástroj pro automatické kategorizování webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.cs
dc.identifier.other79713cs
dc.identifier.urihttp://hdl.handle.net/11012/53297
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectstrojové učeníen
dc.subjectSVMen
dc.subjectcrawleren
dc.subjectroboten
dc.subjectdetekce jazykůen
dc.subjectkategorizaceen
dc.subjectpythonen
dc.subjectweben
dc.subjectmachine learningcs
dc.subjectSVMcs
dc.subjectcrawlercs
dc.subjectlanguage detectioncs
dc.subjectcategorizationcs
dc.subjectpythoncs
dc.subjectwebcs
dc.titleNástroj pro automatické kategorizování webových stráneken
dc.title.alternativeAutomated Web Page Categorization Toolcs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2014-06-25cs
dcterms.modified2020-05-10-16:11:31cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79713en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:17:29en
sync.item.modts2025.01.15 21:30:21en
thesis.disciplinePočítačové sítě a komunikacecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.61 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79713.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_79713.html
Collections