Automatický přepis řeči letecké komunikace do textu

but.committeedoc. Ing. Lukáš Burget, Ph.D. (předseda) prof. Dr. Ing. Jan Černocký (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igorcs
dc.contributor.authorHoláň, Jancs
dc.contributor.refereeVeselý, Karelcs
dc.date.created2025cs
dc.description.abstractTato práce se zabývá automatickým přepisem letecké komunikace do textové podoby s využitím modelu Whisper. Úvodní část představuje specifika letecké komunikace, proces přípravy dat a stručný přehled architektury modelu Whisper založeného na principu transformerů. Hlavní část práce se zaměřuje na experimentální využití promptů, konkrétně na začlenění volacích znaků jako klíčových informací v promluvách. Předpokládá se, že pro každou komunikaci jsou známy volací znaky letadel, se kterými může být vedena. Byly testovány různé typy promptů s cílem analyzovat, jak model Whisper zpracovává tyto informace v kontextu použitých dat. Pro testování vlivu promptů byly natrénovány různé varianty modelů na základě použitých datových sad, přičemž trénování i testování probíhalo na datech s plnou i zkrácenou formou přepisu. Výsledky ukazují, že použití promptů obecně zvyšuje kvalitu přepisu, přičemž nejlepších výsledků bylo dosaženo při použití promptů obsahujících pouze volací znaky přítomné v jednotlivých promluvách. Dále se ukázalo, že množství trénovacích dat má vliv na stabilitu modelů při provádění experimentů s promptem.cs
dc.description.abstractThis thesis deals with the automatic transcription of air traffic into text form using the Whisper model. The introductory part presents the specifics of air traffic, the data preparation process and a brief overview of the architecture of the Whisper model based on the principle of transformers. The main part of the thesis focuses on the experimental use of prompts, specifically the incorporation of call signs as key information in speech. It is assumed that for each communication the call signs of the planes with which it can be conducted are known. Different types of prompts were tested to analyze how the Whisper model handles this information in the context of the data used. To test the effect of the prompts, different variants of the models were trained on the datasets used, with both training and testing performed on both full and short form transcript data. The results show that the use of prompts generally improves transcription quality, with the best results achieved when using prompts containing only the call signs present in individual utterances. Furthermore, the amount of training data was shown to affect the stability of the models when performing experiments with the prompt.en
dc.description.markBcs
dc.identifier.citationHOLÁŇ, J. Automatický přepis řeči letecké komunikace do textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other161415cs
dc.identifier.urihttp://hdl.handle.net/11012/255101
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectfinetuningcs
dc.subjectWhispercs
dc.subjectWhisper Mediumcs
dc.subjectNLPcs
dc.subjectzpracování přirozeného jazykacs
dc.subjecttransformerycs
dc.subjectpříprava datasetůcs
dc.subjecttrénování neuronových sítícs
dc.subjectpromptcs
dc.subjectletecká komunikacecs
dc.subjectfinetuningen
dc.subjectWhisperen
dc.subjectWhisper Mediumen
dc.subjectNLPen
dc.subjectnatural language processingen
dc.subjecttransformersen
dc.subjectdataset preparationen
dc.subjectneural network trainingen
dc.subjectprompten
dc.subjectair traffic communicationen
dc.titleAutomatický přepis řeči letecké komunikace do textucs
dc.title.alternativeAutomatic Transcription of Air-Traffic Communication to Texten
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2025-06-26cs
dcterms.modified2025-06-26-09:59:38cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid161415en
sync.item.dbtypeZPen
sync.item.insts2025.08.27 02:04:33en
sync.item.modts2025.08.26 20:11:27en
thesis.disciplineStrojové učenícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
6.1 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_161415.html
Size:
8.58 KB
Format:
Hypertext Markup Language
Description:
file review_161415.html

Collections