Analýza prosodických a spektrálních vlastností hlasové komunikace v řízení letového provozu
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práca analyzuje prozodické a spektrálne vlastnosti oboch smerov komunikácie riadenia letovej prevádzky, opisuje rozdelenie komunikácie na segmenty v smere od pilota k veži a od veže k pilotovi na základe prepisu. Následne sú jednotlivé segmenty podrobené hĺbkovej analyze ich vlastností. Analyza sa zameriava na spektrum reči v obidvoch smeroch, konkrétne na intenzitu, základnú frekvenciu F0, spektrálnu strmosť a centroid. Naviac ku tomu je vykonaná aj analyza rychlosti reči a detekovania reči. Na základe rozdielnosti tychto parametrov, pre každy smer komunikácie, sú určené faktory, ktoré dopomáhajú k automatickému rozpoznaniu smeru komunikácie.
This thesis analyses the prosodic and spectral features of bi-directional air traffic control communication, describes how to communication was split to segments, according to the source, via transcription. After the splitting, the segments are deeply analyzed for their spectral and prosodic features. The analysis itself, focuses on the spectral aspects of intensity, fundamental frequency F0, slope and centroid. Additionally, tempo and voice activity detection data were measured, to support the spectral aspects as well. Because of the differences between the ATC controller’s and pilots’ spectral aspects, the direction of the communication can be automatically determined, with relatively high success percentage.
This thesis analyses the prosodic and spectral features of bi-directional air traffic control communication, describes how to communication was split to segments, according to the source, via transcription. After the splitting, the segments are deeply analyzed for their spectral and prosodic features. The analysis itself, focuses on the spectral aspects of intensity, fundamental frequency F0, slope and centroid. Additionally, tempo and voice activity detection data were measured, to support the spectral aspects as well. Because of the differences between the ATC controller’s and pilots’ spectral aspects, the direction of the communication can be automatically determined, with relatively high success percentage.
Description
Keywords
ATC komunikácia, spektrum, reč, rozpoznávanie hlasovej aktivity, spektrálne vlastnosti, prozodické vlastnosti, tempo, intenzita, sklon, centroid, základná frekvencia, ATC communication, spectrum, speech, voice activity detection, spectral aspects, prosodic aspects, tempo, intensity, slope, centroid, fundamental frequency
Citation
SIMONIDES, J. Analýza prosodických a spektrálních vlastností hlasové komunikace v řízení letového provozu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda)
Ing. Jiří Přinosil, Ph.D. (místopředseda)
Ing. Jaromír Mačák, Ph.D. (člen)
prof. Ing. Jana Tučková, CSc., CSc. (člen)
Ing.MgA. Edgar Mojdl, Ph.D. (člen)
Ing. Hicham Atassi, Ph.D. (člen)
Date of acceptance
2022-06-16
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Otázky:
1) Popište výpočet Mel-frekvenčních kepstrálních koeficientů (MFCC).
2) Jak byly zastoupeny jednotlivé třídy při trénování? Popište použitý způsob validace (n-fold) a metriky popisující nesprávně detekované instance (např. false positive, falsenegative, precision, recall).
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení