Klasifikace urážlivého textového obsahu bez závislosti na jazyku

Loading...
Thumbnail Image
Date
2019-10-31
Authors
Materna, Jiří
Cvrk, Lubomír
ORCID
Advisor
Referee
Mark
Journal Title
Journal ISSN
Volume Title
Publisher
International Society for Science and Engineering, o.s.
Abstract
Online system providers have to deal with an offensive text published by anonymous users in providers’ systems. Offensive text can be published in the form of posts in discussion forums, user reviews of products or services, or on users’ websites. In this article we describe the design of classifier which automatically recognizes offensive text in Czech and English language. Because the classifier does not utilize lemmatization nor morphological analysis, it does not depend on language.
Poskytovatelé online systémů se musí vypořádat s urážlivým textovým obsahem, který mohou uživatelé prostřednictvím systému zveřejňovat. Může se jednat o příspěvky v diskuzních fórech, uživatelských slovních hodnoceních služeb nebo produktů, případně na uživatelských www stránkách. V článku navrhujeme klasifikátor, který automaticky rozpozná urážlivý text v českém jazyce a v anglickém jazyce. Klasifikátor není závislý na jazyku, nepoužívá lemmatizaci ani morfologickou analýzu.
Description
Keywords
Citation
Elektrorevue. 2019, vol. 21, č. 5, s. 139-145. ISSN 1213-1539
http://www.elektrorevue.cz/
Document type
Peer-reviewed
Document version
Published version
Date of access to the full text
Language of document
cs
Study field
Comittee
Date of acceptance
Defence
Result of defence
Document licence
(C) 2019 Elektrorevue
DOI
Collections
Citace PRO