Large language models for analyzing user-agent conversations

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Dr. Ing. Petr Peringer (člen) Ing. Matěj Grégr, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKesiraju, Santoshen
dc.contributor.authorYeroma, Vladyslaven
dc.contributor.refereeSedláček, Šimonen
dc.date.created2025cs
dc.description.abstractPoužívání velkých jazykových modelů (LLM) pro analýzu konverzace se výrazně rozšířilo v různých odvětvích. Jejich spolehlivost však zůstává sporná kvůli přítomnosti halucinací, chybných interpretací nebo vymyšlených odpovědí. Tento článek zkoumá GPT-4o pro automatickou analýzu reálných konverzací v oblasti péče o zákazníky mezi uživateli a agenty. Konkrétně hodnotíme GPT-4o pro zodpovídání otázek na základě konverzací mezi uživatelem a agentem a následnou pravdivost vygenerovaných odpovědí pomocí GPT-4o jako posuzovatele. Výsledky obou kroků porovnáváme s lidskými anotačními posudky. Uvádíme kategorie halucinací a analýzu chybných úsudků LLM. Naše zjištění poukazují na klíčové oblasti, ve kterých LLM selhávají, a zdůrazňují potřebu zdokonalených verifikačních rámců pro zvýšení jejich spolehlivosti v reálných aplikacích.en
dc.description.abstractThe use of large language models (LLMs) for conversation analysis has gained significant traction in various industries. However, their reliability remains questionable due to the presence of hallucinations, misinterpretations, or fabricated responses. This paper explores GPT-4o for the automatic analysis of real-world customer care conversations between users and agents. We specifically evaluate GPT-4o for question answering based on user--agent conversations and the subsequent veracity of the generated answers using GPT-4o as a judge. The results of both steps are compared against human annotation judgments. We introduce hallucination categories and the analysis of LLM misjudgments. Our findings highlight key areas where LLMs fail, emphasising the need for improved verification frameworks to enhance their reliability in real-world applications.cs
dc.description.markCcs
dc.identifier.citationYEROMA, V. Large language models for analyzing user-agent conversations [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164213cs
dc.identifier.urihttp://hdl.handle.net/11012/253726
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectVelké jazykové modelyen
dc.subjectanalýza konverzacíen
dc.subjectuživatelsko--agentní komunikaceen
dc.subjectzpracování přirozeného jazykaen
dc.subjectanotace daten
dc.subjectverifikační rámceen
dc.subjectLLM jako posuzovatelen
dc.subjecttaxonomie chyben
dc.subjectpromptové inženýrstvíen
dc.subjectLarge language modelscs
dc.subjectconversation analysiscs
dc.subjectuser--agent communicationcs
dc.subjectnatural language processingcs
dc.subjectdata annotationcs
dc.subjectverification frameworkscs
dc.subjectLLM as a judgecs
dc.subjecterror taxonomycs
dc.subjectprompt engineeringcs
dc.titleLarge language models for analyzing user-agent conversationsen
dc.title.alternativeLarge language models for analyzing user-agent conversationscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-18cs
dcterms.modified2025-06-18-15:38:20cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164213en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:57:42en
sync.item.modts2025.08.26 19:58:53en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.23 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164213.html
Size:
13.32 KB
Format:
Hypertext Markup Language
Description:
file review_164213.html

Collections