Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek

Loading...
Thumbnail Image

Date

Authors

Bezecný, Martin

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato práce se zaměřuje na využití velkých jazykových modelů pro úkol sumarizace důležitých informací v audio nahrávkách. Hlavním cílem je vytvořit systém, který bude představovat end-to-end řešení pro analýzu audio nahrávek. Jsou navrženy dva přístupy k implementaci úkolu. První z těchto řešení je založeno na systému pro přímou tvorbu sumarizací z celých textů. Druhá je založena na přístupu generování shrnutí pouze z určitého kontextu, v tomto přístupu je odkazováno na zdroje informací z originálních nahrávek. Výsledky ukazují srovnání přesnosti obou přístupů, přičemž první přístup zahrnuje také srovnání několika velkých jazykových modelů. Tato práce je základem pro budoucí vylepšení takového systému a jeho využití v oblasti bezpečnostní analýzy.
This thesis focuses on the use of large language models for the task of summarizing important information in audio recordings. The main goal is to create a system that will represent an end-to-end solution for the analysis of audio recordings. Two implementation approaches to the task are proposed. The first one is based on the summarization of whole documents. The second one is then on the summary generation from a particular context. In this approach, the sources of information from the original recordings are referenced in the summary. The results show a comparison of the accuracy of the two approaches, with the first approach also including a comparison of several large language models. This work provides a basis for future improvements of such a system and its use in security analysis.

Description

Citation

BEZECNÝ, M. Efektivní využití velkých jazykových modelů pro bezpečnostní analýzu audionahrávek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

bez specializace

Comittee

prof. Ing. Radim Burget, Ph.D. (předseda) doc. Ing. Rastislav Róka, Ph.D. (místopředseda) Ing. Tomáš Gerlich (člen) Ing. Ondřej Krajsa, Ph.D. (člen) Ing. Jan Skapa, Ph.D. (člen) Ing. Róberta Hlavatá, Ph.D. (člen) JUDr. Mgr. Jakub Harašta, Ph.D. (člen)

Date of acceptance

2025-06-09

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Otázky oponenta: 1) V práci popisujete, že audio nahrávky sú vytvorené pomocou TTS - môžete spresniť či sa jedná o jedného rečníka, alebo viacerých a aké modifikácie by boli potrebné aby model generalizoval (nebol závislý na rečníkovi)? 2) Poslednou časťou zadania je praktická aplikácia algoritmu, prosím uveďte príklady. Otázky komise: 1) Které konkrétní části práce byly vypracovány studentem? 2) Proč bylo zvoleno zaměření na český jazyk? 3) Řešil jste nějakým způsobem faktické chyby?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO