Automatická segmentace řeči pro VHF kanál
but.committee | prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) | cs |
but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Szőke, Igor | en |
dc.contributor.author | Nováková, Mária | en |
dc.contributor.referee | Veselý, Karel | en |
dc.date.created | 2023 | cs |
dc.description.abstract | Výskyt hluku a šumu v pozadí audio leteckej komunikácie je problémom, ktorému denne čelia operanti riadenia letovej prevádzky. Aby bola zaistená bezpečná letecká preprava, komunikácia medzi vežou a lietatlom musí byť čo najefektívnejšia. Hlavnú rolu vo vylepšovaní kvality komunikácie hrá detekcia hlasovej aktivity. Správna detekcia reči je nevyhnutá pre rozpoznanie začiatku komunikácie pre systémy. Začiatok komunikácie začína stlačením tlačítka push-to-talk pomocou rádiového systému. Na rozpoznávanie reči existujú rôzne prístupy a implementácie. Za pomoci neurónových sietí sa dá detekcia reči upresniť. Výhodou používania umelej inteligencie je jej adaptácia na nové podnety. Táto práca ponúka riešenie na detekciu reči a push-to-talk udalostí v leteckej komunikácií. Navrhnuté riešenia budú evaluované a porovnané. Na záver, dostupná implementácia GPVAD je prepracovaná na riešenie tohto problému. Strojové učenie má zas a znova príležitosť predviesť svoje schopnosti. | en |
dc.description.abstract | A noisy environment in air traffic communication is an unavoidable problem. The communication between the control tower and the pilot should be the most reliable and effective. That is why voice activity detection is crucial for recognising the start of the speech segment of the communicants for automated systems. The speakers take turns providing information by pressing the push-to-talk button. To detect voice activity, various approaches are used. Even though these methods are effective, machine learning can easily outshine them. Neural networks are widely used in voice activity detection as well as in other areas. Properly trained models are efficient and adaptable. In this thesis, a solution for voice activity detection together with push-to-talk detection is proposed. Proposed models are evaluated and compared. The adaptation of the GPVAD approach is discussed and compared to the proposed models. Neural networks will have their chance to once again prove that they are suitable for any task. | cs |
dc.description.mark | B | cs |
dc.identifier.citation | NOVÁKOVÁ, M. Automatická segmentace řeči pro VHF kanál [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023. | cs |
dc.identifier.other | 140508 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/211027 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | detekcia hlasovej aktivity | en |
dc.subject | push-to-talk | en |
dc.subject | veľmi vysokofrekvenčný kanál | en |
dc.subject | python | en |
dc.subject | riadenie letovej prevádzky | en |
dc.subject | umelé neurónové siete | en |
dc.subject | hlboké učenie | en |
dc.subject | konvolučné neurónové siete | en |
dc.subject | konvolučné rekurentné neurónové siete | en |
dc.subject | augmentácia dát | en |
dc.subject | anotácia | en |
dc.subject | voice activity detection | cs |
dc.subject | push-to-talk | cs |
dc.subject | very high-frequency channel | cs |
dc.subject | python | cs |
dc.subject | air traffic control | cs |
dc.subject | artificial neural networks | cs |
dc.subject | deep learning | cs |
dc.subject | convolutional neural networks | cs |
dc.subject | convolutional recurrent neural networks | cs |
dc.subject | data augmentation | cs |
dc.subject | annotation | cs |
dc.title | Automatická segmentace řeči pro VHF kanál | en |
dc.title.alternative | Automatic Speech Detection for VHF Channel | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2023-06-15 | cs |
dcterms.modified | 2023-06-15-16:13:34 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 140508 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:46:07 | en |
sync.item.modts | 2025.01.17 13:07:02 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.96 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- appendix-1.pdf
- Size:
- 474.69 KB
- Format:
- Adobe Portable Document Format
- Description:
- appendix-1.pdf
Loading...
- Name:
- review_140508.html
- Size:
- 9.92 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_140508.html