Určování podobnosti příběhů
Loading...
Date
Authors
Sabol, František
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Porovnávanie podobnosti príbehov predstavuje komplexnú výzvu. Táto diplomová práca rieši tento problém návrhom a implementáciou systému využívajúceho veľké jazykové modely pre aspektovo orientovanú analýzu príbehov – zameranú na dej, postavy, prostredie a témy – s cieľom umožniť granulárne a interpretovateľné porovnávania. Významným prínosom práce je webové používateľské rozhranie, ktoré umožňuje exploratívne vyhľadávanie, vizualizáciu podobností naprieč aspektmi a detailné skúmanie analýz. Systém taktiež integruje agenta založeného na princípoch Retrieval-Augmented Generation (RAG) pre objavovanie príbehov. Pre evaluáciu systému a prínosu analýz veľkých jazykových modelov bola vytvorená nová dátová sada určená na evaluáciu vyhľadávania podobných príbehov. Experimentálne výsledky potvrdzujú, že dáta z viac-aspektovej analýzy, integrované do vyhľadávacieho procesu, majú pozitívny vplyv na výsledne pozorované metriky. Práca tak demonštruje funkčný systém a potvrdzuje prínos granulárnej, aspektovej analýzy, prezentovanej prostredníctvom používateľsky orientovaného rozhrania, pre exploráciu podobnosti medzi príbehmi.
Comparing story similarity presents a complex challenge. This diploma thesis addresses this problem by designing and implementing a system that utilizes large language models for aspect-oriented story analysis – focusing on plot, characters, setting, and themes – to enable granular and interpretable comparisons. A significant contribution of the thesis is a web user interface that allows for exploratory search, visualization of similarities across aspects, and detailed examination of analyses. The system also integrates an agent based on Retrieval-Augmented Generation (RAG) principles for story discovery. For the evaluation of the system and the contribution of large language model analyses, a new dataset was created for evaluating the retrieval of similar stories. Experimental results confirm that data from the multi-aspect analysis, integrated into the search process, have a positive impact on the observed metrics. The thesis thus demonstrates a functional system and confirms the benefit of granular, aspect-based analysis, presented through a user-oriented interface, for exploring similarity between stories.
Comparing story similarity presents a complex challenge. This diploma thesis addresses this problem by designing and implementing a system that utilizes large language models for aspect-oriented story analysis – focusing on plot, characters, setting, and themes – to enable granular and interpretable comparisons. A significant contribution of the thesis is a web user interface that allows for exploratory search, visualization of similarities across aspects, and detailed examination of analyses. The system also integrates an agent based on Retrieval-Augmented Generation (RAG) principles for story discovery. For the evaluation of the system and the contribution of large language model analyses, a new dataset was created for evaluating the retrieval of similar stories. Experimental results confirm that data from the multi-aspect analysis, integrated into the search process, have a positive impact on the observed metrics. The thesis thus demonstrates a functional system and confirms the benefit of granular, aspect-based analysis, presented through a user-oriented interface, for exploring similarity between stories.
Description
Keywords
veľké jazykové modely , naratológia , analýza príbehov , porovnávanie podobnosti príbehov , sémantické vyhľadávanie , RAG , Vespa , vektorová reprezentácia textu , Adalflow , large language models , narratology , aspect-oriented narrative analysis , narrative similarity , semantic retrieval , RAG , Vespa , text embeddings , Adalflow
Citation
SABOL, F. Určování podobnosti příběhů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Zpracování zvuku, řeči a přirozeného jazyka
Comittee
doc. Mgr. Adam Rogalewicz, Ph.D. (předseda)
doc. RNDr. Pavel Smrž, Ph.D. (člen)
doc. Ing. František Zbořil, CSc. (člen)
Dr. Ing. Petr Peringer (člen)
Ing. Aleš Smrčka, Ph.D. (člen)
Ing. Ondřej Lengál, Ph.D. (člen)
Date of acceptance
2025-06-26
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Result of defence
práce byla úspěšně obhájena
