Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí

Loading...
Thumbnail Image

Date

Authors

Homoliak, Ivan

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Práce se zabýva zkoumáním závislostí kvality klasifikace textových řetězců na vlastnostech vybraných řetězcových funkcí, použitých na určení míry podobnosti dvou textových řetezců. Práce přešetřuje též kombinování výsledků řetězcových funkcí aritmetickými operacemi plus a krát. Získané výsledky se v práci aplikují na detekci nevyžádané elektronické pošty.
Publication aims to explore dependencies of text classification used with string kernel functions. String kernel functions are here used to retrieve rate of similarity between two text strings. There are described experiments with single string kernel function and also experiments with combinations of them with arithmetic operations of adition and multiplication. Gathered results are aplied to detect spam messages of e-mail communication.

Description

Citation

HOMOLIAK, I. Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen)

Date of acceptance

2010-06-14

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komisi byly přečteny posudky od vedoucího a oponenta práce. Student následně odpověděl na otázky oponenta a na doplňující otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Která z funkcí N-Gram a Gap-Weighted Subsequence rychleji určí míru podobnosti dvou řetězců a proč? Je funkce Bag of Word aplikovatelná na určení míry podobnosti v síťovém provozu? Co je to míra podobnosti dvou řetězců?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO