Systém pro rozpoznávání dezinformací v prostředí webu
Loading...
Date
Authors
Večerka, Lukáš
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce se zabyvá návrhem, realizací a ověřením systému pro automatické rozpoznávání dezinformací v prostředí webu. Představuje problematiku šíření dezinformací v online prostředí a jeho dopad na společnost. Zaměřuje se na trénování několika Českych transformers jazykovych modelů pro rozpoznání dezinformací a dále na automatickou extrakci obsahu článků z českych internetovych novin a jejich analyzu využitím klasifikace textu a zpracování přirozeného jazyka pomocí metod hlubokého učení. Vysledky těchto analyz jsou pak prezentovány na webovém uživatelském rozhraní s cílem poskytnout platformu pro ověření článků, autorů a zdrojů. Rozhraní by mohlo byt použito k anotaci dat experty pro průběžné vylepšování jazykovych modelů.
This work deals with the design, implementation, and verification of a system for automatic recognition of disinformation on the web. It addresses the issue of disinformation spread in the online environment and its impact on society. It focuses on training several Czech transformer language models for disinformation recognition and further automatic extraction of content from Czech online newspapers and their analysis using text classification and natural language processing through deep learning methods. The results of these analyses are then presented in a web user interface with the aim of providing a platform for verifying articles, authors, and sources. The interface could be used for data annotation by experts for continuous improvement of language models.
This work deals with the design, implementation, and verification of a system for automatic recognition of disinformation on the web. It addresses the issue of disinformation spread in the online environment and its impact on society. It focuses on training several Czech transformer language models for disinformation recognition and further automatic extraction of content from Czech online newspapers and their analysis using text classification and natural language processing through deep learning methods. The results of these analyses are then presented in a web user interface with the aim of providing a platform for verifying articles, authors, and sources. The interface could be used for data annotation by experts for continuous improvement of language models.
Description
Keywords
dezinformace, web, zpracování přirozeného jazyka, strojové učení, hluboké učení, extrakce dat, NLP, fake news, důvěryhodnost, klasifikace textu, architektura transformers, disinformation, Web, NLP, natural language processing, machine learning, deep learning, web scraping, data extraction, fake news, credibility, text classification, transformers architecture
Citation
VEČERKA, L. Systém pro rozpoznávání dezinformací v prostředí webu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Tomáš Hruška, CSc. (předseda)
Ing. Šárka Květoňová, Ph.D. (člen)
Ing. Bohuslav Křena, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Jiří Matoušek, Ph.D. (člen)
Date of acceptance
2024-06-13
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení