Konverze šeptané řeči na normální

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Na schématu 3.2 upřesněte, zda byly pro konverzi skutečně využity statické parametry z neutrální řeči a delta-koeficienty z šeptané? Jak byla vyhodnocována Mel Cepstral Distortion a jak koreluje s poslechovou kvalitou ? Je při pořízení nahrávky na mobilním telefonu tato nějak segmentována (pomocí VAD nebo rovnoměrně) nebo je na server poslána vcelku ? V čem je lepší tato metoda než využití filtrů pro zvýraznění konkrétních frekvencí v šeptané řeči? Zkoušel jste zašumět vstupní data pro trénování?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBrukner, Janen
dc.contributor.authorGajda, Richarden
dc.contributor.refereeČernocký, Janen
dc.date.created2021cs
dc.description.abstractCílem této práce je vyvinout funkční program, který konvertuje vstupní šeptanou řeč na neutrální za pomoci predikce hlasového buzení, která je získána pomocí neuronových sítí. Práce je založena na studii z Indian Institute of Science v indickém Bengalúru. Řešení je provedeno následovně: nejprve získáme trénovací dataset řečníků, poté implementujeme zpracování řeči a její parametrizaci za pomoci vokodéru WORLD, vytvoříme a natrénujeme neuronovou síť, provedeme experimenty, které vyhodnotíme, a nakonec navrhneme použití pro budoucí aplikace a vylepšení.en
dc.description.abstractThe aim of this thesis is to develop a working program, that converts whispered speech input into voice using vocal excitation prediction, which is obtained from a neural network. The work is based on a study from Indian Institute of Science in Bengalore, India. The approach to the solution is the following: to acquire a dataset from training speakers, to implement the speech parameterization using the WORLD vocoder, to implement and train the neural networks, to experiment, to evaluate the results and, finally,  to propose future applications and improvements.cs
dc.description.markCcs
dc.identifier.citationGAJDA, R. Konverze šeptané řeči na normální [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136407cs
dc.identifier.urihttp://hdl.handle.net/11012/198902
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSyntéza řečien
dc.subjectšepoten
dc.subjectWORLDen
dc.subjectBLSTMen
dc.subjectkonverze.en
dc.subjectSpeech synthesiscs
dc.subjectwhispered speechcs
dc.subjectWORLDcs
dc.subjectBLSTMcs
dc.subjectconversion.cs
dc.titleKonverze šeptané řeči na normálníen
dc.title.alternativeConversion of Whispered to Normal Voicecs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-06-16cs
dcterms.modified2021-06-17-14:24:36cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136407en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:33:37en
sync.item.modts2025.01.15 14:54:18en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.38 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22505_v.pdf
Size:
85.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22505_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22505_o.pdf
Size:
89.19 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22505_o.pdf
Loading...
Thumbnail Image
Name:
review_136407.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
file review_136407.html
Collections