Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí

Homoliak, Ivan

Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí

Files

review_34909.html (1.48 KB)

Authors

Homoliak, Ivan

Advisor

Michlovský, Zbyněk

Referee

Drozd, Michal

Mark

A

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Práce se zabýva zkoumáním závislostí kvality klasifikace textových řetězců na vlastnostech vybraných řetězcových funkcí, použitých na určení míry podobnosti dvou textových řetezců. Práce přešetřuje též kombinování výsledků řetězcových funkcí aritmetickými operacemi plus a krát. Získané výsledky se v práci aplikují na detekci nevyžádané elektronické pošty.
Publication aims to explore dependencies of text classification used with string kernel functions. String kernel functions are here used to retrieve rate of similarity between two text strings. There are described experiments with single string kernel function and also experiments with combinations of them with arithmetic operations of adition and multiplication. Gathered results are aplied to detect spam messages of e-mail communication.

Keywords

řetězcové funkce , libSVM , klasifikace , umělá inteligence , string kernel functions , libSVM , classification , artificial inteligence

Citation

HOMOLIAK, I. Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.

Language of document

cs

Study field

Informační technologie

Comittee

doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen)

Date of acceptance

2010-06-14

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komisi byly přečteny posudky od vedoucího a oponenta práce. Student následně odpověděl na otázky oponenta a na doplňující otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Která z funkcí N-Gram a Gap-Weighted Subsequence rychleji určí míru podobnosti dvou řetězců a proč? Je funkce Bag of Word aplikovatelná na určení míry podobnosti v síťovém provozu? Co je to míra podobnosti dvou řetězců?

Result of defence

práce byla úspěšně obhájena

URI

http://hdl.handle.net/11012/55997

Collections

2010

Citace PRO

Full item page

Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí

Files

Date

Authors

Advisor

Referee

Mark

Journal Title

Journal ISSN

Volume Title

Publisher

ORCID

Abstract

Description

Keywords

Citation

Document type

Document version

Date of access to the full text

Language of document

Study field

Comittee

Date of acceptance

Defence

Result of defence

DOI

URI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO