Strojové učení v oblasti stylometrie a určování autorství

Loading...
Thumbnail Image

Date

Authors

Drápela, Karel

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Práce se zabývá identifikací autorů anglických internetových komentářů. Popisuje aktuální stav v oboru určování autorství na sociálních sítích. Vysvětluje fungování a strukturu vytvořeného systému na určování autorství, který funguje na základě výběru nejinformativnějších příznaků z převážně písmemnných n-gramů a slovních druhů. Prezentuje výsledky testování systému na internetových službách Quora a Twitter.
Thesis deals with authorship attribution of english internet comments. It describes state of art in authorship attribution on social networks. It decsribes how the new system created during the work on this thesis functions. System is based on selection of most informative characteristics mostly from character n-grams and part of speech tags. It presents results of testing on comments from social networks Quora and Twitter.

Description

Citation

DRÁPELA, K. Strojové učení v oblasti stylometrie a určování autorství [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

prof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)

Date of acceptance

2016-06-15

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Rozveďte význam charakteristiky písemných n-gramů a diskutujte jejich efekt na krátkých textech z Twitteru v porovnání s delšími texty. Stručně zdůvodněte příčinu lepších výsledků dosažených s metodou výběru příznaků "informační přínos" oproti jiným metodám.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO