Klasifikace urážlivého textového obsahu bez závislosti na jazyku

Loading...
Thumbnail Image

Authors

Materna, Jiří
Cvrk, Lubomír

Advisor

Referee

Mark

Journal Title

Journal ISSN

Volume Title

Publisher

International Society for Science and Engineering, o.s.

ORCID

Abstract

Online system providers have to deal with an offensive text published by anonymous users in providers’ systems. Offensive text can be published in the form of posts in discussion forums, user reviews of products or services, or on users’ websites. In this article we describe the design of classifier which automatically recognizes offensive text in Czech and English language. Because the classifier does not utilize lemmatization nor morphological analysis, it does not depend on language.
Poskytovatelé online systémů se musí vypořádat s urážlivým textovým obsahem, který mohou uživatelé prostřednictvím systému zveřejňovat. Může se jednat o příspěvky v diskuzních fórech, uživatelských slovních hodnoceních služeb nebo produktů, případně na uživatelských www stránkách. V článku navrhujeme klasifikátor, který automaticky rozpozná urážlivý text v českém jazyce a v anglickém jazyce. Klasifikátor není závislý na jazyku, nepoužívá lemmatizaci ani morfologickou analýzu.

Description

Keywords

Citation

Elektrorevue. 2019, vol. 21, č. 5, s. 139-145. ISSN 1213-1539
http://www.elektrorevue.cz/

Document type

Peer-reviewed

Document version

Published version

Date of access to the full text

Language of document

cs

Study field

Comittee

Date of acceptance

Defence

Result of defence

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO