Převod šeptané řeči na normální

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. RNDr. Pavel Smrž, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykangličtina (English)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBrukner, Janen
dc.contributor.authorGajda, Richarden
dc.contributor.refereeČernocký, Janen
dc.date.created2024cs
dc.description.abstractCílem této práce je vyvinout alternativní řešení k potřebě paralelních datasetů pro natrénování modelů pro konverzi šeptané řeči na normální, a to za pomoci syntézy pseudo-šeptané řeči. Pseudo-šeptané datasety, vygenerované z open-source řečových datasetů jsou použity pro natrénování modelu pro konverzi řeči - na vokodéru BigVGAN. Tento natrénovaný model je nezávislý na mluvčím i jazyce a je ve výsledku porovnán s výchozí implementací (baseline) a již existujícími řešeními.en
dc.description.abstractThe goal of this thesis is to develop an alternative solution to parallel datasets needed for whispered to normal voice speech conversion, using pseudo-whispered speech synthesis. Psuedo-whispered datasets generated from open source voice datasets are used to train a voice conversion model (vocoder BigVGAN) which is both speaker and language independent. Resulting model is compared to a baseline and existing solutions.cs
dc.description.markCcs
dc.identifier.citationGAJDA, R. Převod šeptané řeči na normální [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other155732cs
dc.identifier.urihttp://hdl.handle.net/11012/248569
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectŠeptaná Řečen
dc.subjectSyntéza Pseudo-Šeptané Řečien
dc.subjectZpracování Signálůen
dc.subjectKonverze Šeptané Řeči na Normálníen
dc.subjectWhispered Speechcs
dc.subjectPseudo-whispered Speech Synthesiscs
dc.subjectSignal Processingcs
dc.subjectW2N Speech Conversioncs
dc.titlePřevod šeptané řeči na normálníen
dc.title.alternativeWhispered to Normal Speech Conversioncs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2024-06-17cs
dcterms.modified2024-06-17-15:10:57cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid155732en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:38:04en
sync.item.modts2025.01.15 23:59:25en
thesis.disciplineZpracování zvuku, řeči a přirozeného jazykacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.95 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_155732.html
Size:
10.83 KB
Format:
Hypertext Markup Language
Description:
file review_155732.html
Collections