Simulace pohybujícího se řečníka/řečníků v místnosti s ozvěnou

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igorsk
dc.contributor.authorKováčiková, Janask
dc.contributor.refereeČernocký, Jansk
dc.date.created2025cs
dc.description.abstractCieľom tejto práce je priblížiť proces simulovania akustiky miestnosti s ozvenou a dynamickými zmenami pozícií rečníka s použítím knižnice Pyroomacoustics. Súčasťou práce je získavanie vlastných dát v malej miestnosti (3,45 × 3,91 × 2,62 m), v ktorej sme manipulovali mierou ozveny odoberaním predmetov. Na účely automatického rozpoznávania reči boli vytvorené dva datasety. V prvom z nich bol pridaný dynamický pohyb bez ozveny (maximálna absorbcia stien), druhý obsahuje dynamický pohyb s pridanou ozvenou. Práca sa ďalej zaoberá adaptáciou modelu Whisper od spoločnosti OpenAI na vytvorených datasetoch. Adaptáciou modelu Whisper Medium na vytvorenej dátovej sade s ozvenou sa znížila hodnota WER o 4,89 % na evaluačných dátach.sk
dc.description.abstractThis thesis aims to approach the process of simulating the acoustics of a room with reverberation and dynamic changes in speaker position using the Pyroomacoustics library. This work also involved acquiring our own data in a small room (3.45 × 3.91 × 2.62 m) where the reverberation was adjusted by removing objects. Two datasets were created for automatic speech recognition purposes. The first includes only movement without reverberation (maximal wall absorption), and the second dataset includes movement with added reverberation. The thesis further covers the adaptation of the automatic speech recognition model Whisper by OpenAI on the generated datasets. By fine-tuning the Whisper Medium model on a reverberation dataset, we decreased WER by 4.89 % on evaluation data.en
dc.description.markBcs
dc.identifier.citationKOVÁČIKOVÁ, J. Simulace pohybujícího se řečníka/řečníků v místnosti s ozvěnou [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other158850cs
dc.identifier.urihttp://hdl.handle.net/11012/252759
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectakustika miestnostisk
dc.subjectozvenask
dc.subjectimpulzná odozva miestnostisk
dc.subjectautomatické rozpoznávanie rečisk
dc.subjectroom acousticsen
dc.subjectreverberationen
dc.subjectroom impulse responseen
dc.subjectautomatic speech recognitionen
dc.titleSimulace pohybujícího se řečníka/řečníků v místnosti s ozvěnousk
dc.title.alternativeSimulation of moving speaker(s) in a reverberant roomen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-16cs
dcterms.modified2025-06-16-12:45:46cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid158850en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:02:41en
sync.item.modts2025.08.26 19:58:39en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
12.52 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_158850.html
Size:
11.31 KB
Format:
Hypertext Markup Language
Description:
file review_158850.html

Collections