Simulace pohybujícího se řečníka/řečníků v místnosti s ozvěnou
| but.committee | prof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. | cs |
| but.jazyk | čeština (Czech) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Szőke, Igor | cs |
| dc.contributor.author | Bílek, Štěpán | cs |
| dc.contributor.referee | Černocký, Jan | cs |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato diplomová práce se zabývá simulací řeči pohybujícího se mluvčího v ozvěnou zatíženém prostředí jakožto specifickou formou augmentace dat pro automatické rozpoznávání řeči. Cílem je vytvořit nástroj, který na základě běžné audio nahrávky, rozměrů a materiálů místnosti, trajektorie a rychlosti zdroje zvuku, pozice mikrofonů a jejich směrových charakteristik vygeneruje co nejvěrnější záznam řeči, která by reálně vznikla v dané místnosti za předpokladu pohybu mluvčího. K implementaci je využita knihovna pyroomacoustics, umožňující modelování akustiky uzavřeného prostoru a vytváření příslušných impulsních odezev. Takto vytvořená data poté slouží k adaptaci modelu Whisper pro automatické rozpoznávání řeči. | cs |
| dc.description.abstract | This thesis focuses on simulating speech from a moving speaker in a reverberant environment as a specialized form of data augmentation for automatic speech recognition. The primary goal is to develop a tool that, based on a standard audio recording, room dimensions and materials, the source trajectory and velocity, and the position and directional characteristics of microphones, can generate an audio recording that closely approximates the real sound of speech in motion within a given room. The implementation utilizes the pyroomacoustics library, which supports modeling of enclosed room acoustics and corresponding impulse responses. The resulting augmented data are then used to fine-tune the Whisper model for automatic speech recognition | en |
| dc.description.mark | D | cs |
| dc.identifier.citation | BÍLEK, Š. Simulace pohybujícího se řečníka/řečníků v místnosti s ozvěnou [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164722 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/252816 | |
| dc.language.iso | cs | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | Automatické rozpoznávání řeči | cs |
| dc.subject | augmentace zvukových dat | cs |
| dc.subject | simulace | cs |
| dc.subject | akustika | cs |
| dc.subject | impulsní odezva místnosti | cs |
| dc.subject | RIR | cs |
| dc.subject | pyroomacoustics | cs |
| dc.subject | Whisper | cs |
| dc.subject | Automatic speech recognition | en |
| dc.subject | audio data augmentation | en |
| dc.subject | simulation | en |
| dc.subject | acoustics | en |
| dc.subject | room impulse response | en |
| dc.subject | RIR | en |
| dc.subject | pyroomacoustics | en |
| dc.subject | Whisper | en |
| dc.title | Simulace pohybujícího se řečníka/řečníků v místnosti s ozvěnou | cs |
| dc.title.alternative | Simulation of moving speaker(s) in a reverberant room | en |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-16 | cs |
| dcterms.modified | 2025-06-16-09:52:24 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164722 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:04:01 | en |
| sync.item.modts | 2025.08.26 19:43:42 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
