Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek
Loading...
Date
Authors
Bezecný, Martin
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Tato práce se zaměřuje na využití velkých jazykových modelů pro úkol sumarizace důležitých informací v audio nahrávkách. Hlavním cílem je vytvořit systém, který bude představovat end-to-end řešení pro analýzu audio nahrávek. Jsou navrženy dva přístupy k implementaci úkolu. První z těchto řešení je založeno na systému pro přímou tvorbu sumarizací z celých textů. Druhá je založena na přístupu generování shrnutí pouze z určitého kontextu, v tomto přístupu je odkazováno na zdroje informací z originálních nahrávek. Výsledky ukazují srovnání přesnosti obou přístupů, přičemž první přístup zahrnuje také srovnání několika velkých jazykových modelů. Tato práce je základem pro budoucí vylepšení takového systému a jeho využití v oblasti bezpečnostní analýzy.
This thesis focuses on the use of large language models for the task of summarizing important information in audio recordings. The main goal is to create a system that will represent an end-to-end solution for the analysis of audio recordings. Two implementation approaches to the task are proposed. The first one is based on the summarization of whole documents. The second one is then on the summary generation from a particular context. In this approach, the sources of information from the original recordings are referenced in the summary. The results show a comparison of the accuracy of the two approaches, with the first approach also including a comparison of several large language models. This work provides a basis for future improvements of such a system and its use in security analysis.
This thesis focuses on the use of large language models for the task of summarizing important information in audio recordings. The main goal is to create a system that will represent an end-to-end solution for the analysis of audio recordings. Two implementation approaches to the task are proposed. The first one is based on the summarization of whole documents. The second one is then on the summary generation from a particular context. In this approach, the sources of information from the original recordings are referenced in the summary. The results show a comparison of the accuracy of the two approaches, with the first approach also including a comparison of several large language models. This work provides a basis for future improvements of such a system and its use in security analysis.
Description
Citation
BEZECNÝ, M. Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
bez specializace
Comittee
prof. Ing. Radim Burget, Ph.D. (předseda)
doc. Ing. Rastislav Róka, Ph.D. (místopředseda)
Ing. Tomáš Gerlich (člen)
Ing. Ondřej Krajsa, Ph.D. (člen)
Ing. Jan Skapa, Ph.D. (člen)
Ing. Róberta Hlavatá, Ph.D. (člen)
JUDr. Mgr. Jakub Harašta, Ph.D. (člen)
Date of acceptance
2025-06-09
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Otázky oponenta:
1) V práci popisujete, že audio nahrávky sú vytvorené pomocou TTS - môžete spresniť či sa jedná o jedného rečníka, alebo viacerých a aké modifikácie by boli potrebné aby model generalizoval (nebol závislý na rečníkovi)?
2) Poslednou časťou zadania je praktická aplikácia algoritmu, prosím uveďte príklady.
Otázky komise:
1) Které konkrétní části práce byly vypracovány studentem?
2) Proč bylo zvoleno zaměření na český jazyk?
3) Řešil jste nějakým způsobem faktické chyby?
Result of defence
práce byla úspěšně obhájena
