Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek

Tato práce se zaměřuje na využití velkých jazykových modelů pro úkol sumarizace důležitých informací v audio nahrávkách. Hlavním cílem je vytvořit systém, který bude představovat end-to-end řešení pro analýzu audio nahrávek. Jsou navrženy dva přístupy k implementaci úkolu. První z těchto řešení je založeno na systému pro přímou tvorbu sumarizací z celých textů. Druhá je založena na přístupu generování shrnutí pouze z určitého kontextu, v tomto přístupu je odkazováno na zdroje informací z originálních nahrávek. Výsledky ukazují srovnání přesnosti obou přístupů, přičemž první přístup zahrnuje také srovnání několika velkých jazykových modelů. Tato práce je základem pro budoucí vylepšení takového systému a jeho využití v oblasti bezpečnostní analýzy.
This thesis focuses on the use of large language models for the task of summarizing important information in audio recordings. The main goal is to create a system that will represent an end-to-end solution for the analysis of audio recordings. Two implementation approaches to the task are proposed. The first one is based on the summarization of whole documents. The second one is then on the summary generation from a particular context. In this approach, the sources of information from the original recordings are referenced in the summary. The results show a comparison of the accuracy of the two approaches, with the first approach also including a comparison of several large language models. This work provides a basis for future improvements of such a system and its use in security analysis.

Keywords

velké jazykové modely , audio nahrávky , rozšíření generace pomocí vyhledávání , automatické rozpoznávání řeči , bezpečnostní analýza , sumarizace , Large Language Models , Audio Recording , Retrieval Augemented Generation , Automatic Speech Recognition , Security Analysis , Summarization

Citation

BEZECNÝ, M. Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Language of document

en

Study field

bez specializace

Comittee

prof. Ing. Radim Burget, Ph.D. (předseda) doc. Ing. Rastislav Róka, Ph.D. (místopředseda) Ing. Tomáš Gerlich (člen) Ing. Ondřej Krajsa, Ph.D. (člen) Ing. Jan Skapa, Ph.D. (člen) Ing. Róberta Hlavatá, Ph.D. (člen) JUDr. Mgr. Jakub Harašta, Ph.D. (člen)

Date of acceptance

2025-06-09

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Otázky oponenta: 1) V práci popisujete, že audio nahrávky sú vytvorené pomocou TTS - môžete spresniť či sa jedná o jedného rečníka, alebo viacerých a aké modifikácie by boli potrebné aby model generalizoval (nebol závislý na rečníkovi)? 2) Poslednou časťou zadania je praktická aplikácia algoritmu, prosím uveďte príklady. Otázky komise: 1) Které konkrétní části práce byly vypracovány studentem? 2) Proč bylo zvoleno zaměření na český jazyk? 3) Řešil jste nějakým způsobem faktické chyby?

Result of defence

práce byla úspěšně obhájena

URI

http://hdl.handle.net/11012/251481

Collections

2025

Citace PRO

Full item page

Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek

Files

Date

Authors

Advisor

Referee

Mark

Journal Title

Journal ISSN

Volume Title

Publisher

ORCID

Abstract

Description

Keywords

Citation

Document type

Document version

Date of access to the full text

Language of document

Study field

Comittee

Date of acceptance

Defence

Result of defence

DOI

URI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO