Automatická segmentace řeči pro VHF kanál

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igoren
dc.contributor.authorNováková, Máriaen
dc.contributor.refereeVeselý, Karelen
dc.date.created2023cs
dc.description.abstractVýskyt hluku a šumu v pozadí audio leteckej komunikácie je problémom, ktorému denne čelia operanti riadenia letovej prevádzky. Aby bola zaistená bezpečná letecká preprava, komunikácia medzi vežou a lietatlom musí byť čo najefektívnejšia. Hlavnú rolu vo vylepšovaní kvality komunikácie hrá detekcia hlasovej aktivity. Správna detekcia reči je nevyhnutá pre rozpoznanie začiatku komunikácie pre systémy. Začiatok komunikácie začína stlačením tlačítka push-to-talk pomocou rádiového systému. Na rozpoznávanie reči existujú rôzne prístupy a implementácie. Za pomoci neurónových sietí sa dá detekcia reči upresniť. Výhodou používania umelej inteligencie je jej adaptácia na nové podnety. Táto práca ponúka riešenie na detekciu reči a push-to-talk udalostí v leteckej komunikácií. Navrhnuté riešenia budú evaluované a porovnané. Na záver, dostupná implementácia GPVAD je prepracovaná na riešenie tohto problému. Strojové učenie má zas a znova príležitosť predviesť svoje schopnosti.en
dc.description.abstractA noisy environment in air traffic communication is an unavoidable problem. The communication between the control tower and the pilot should be the most reliable and effective. That is why voice activity detection is crucial for recognising the start of the speech segment of the communicants for automated systems. The speakers take turns providing information by pressing the push-to-talk button. To detect voice activity, various approaches are used. Even though these methods are effective, machine learning can easily outshine them. Neural networks are widely used in voice activity detection as well as in other areas. Properly trained models are efficient and adaptable. In this thesis, a solution for voice activity detection together with push-to-talk detection is proposed. Proposed models are evaluated and compared. The adaptation of the GPVAD approach is discussed and compared to the proposed models. Neural networks will have their chance to once again prove that they are suitable for any task.cs
dc.description.markBcs
dc.identifier.citationNOVÁKOVÁ, M. Automatická segmentace řeči pro VHF kanál [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other140508cs
dc.identifier.urihttp://hdl.handle.net/11012/211027
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdetekcia hlasovej aktivityen
dc.subjectpush-to-talken
dc.subjectveľmi vysokofrekvenčný kanálen
dc.subjectpythonen
dc.subjectriadenie letovej prevádzkyen
dc.subjectumelé neurónové sieteen
dc.subjecthlboké učenieen
dc.subjectkonvolučné neurónové sieteen
dc.subjectkonvolučné rekurentné neurónové sieteen
dc.subjectaugmentácia dáten
dc.subjectanotáciaen
dc.subjectvoice activity detectioncs
dc.subjectpush-to-talkcs
dc.subjectvery high-frequency channelcs
dc.subjectpythoncs
dc.subjectair traffic controlcs
dc.subjectartificial neural networkscs
dc.subjectdeep learningcs
dc.subjectconvolutional neural networkscs
dc.subjectconvolutional recurrent neural networkscs
dc.subjectdata augmentationcs
dc.subjectannotationcs
dc.titleAutomatická segmentace řeči pro VHF kanálen
dc.title.alternativeAutomatic Speech Detection for VHF Channelcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-15cs
dcterms.modified2023-06-15-16:13:34cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid140508en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:46:07en
sync.item.modts2025.01.17 13:07:02en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.96 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.pdf
Size:
474.69 KB
Format:
Adobe Portable Document Format
Description:
appendix-1.pdf
Loading...
Thumbnail Image
Name:
review_140508.html
Size:
9.92 KB
Format:
Hypertext Markup Language
Description:
file review_140508.html
Collections