Kódování řeči na velmi nízkých bitových rychlostech založené na neuronových sítích

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. František Zbořil, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorJochman, Stanislaven
dc.contributor.refereeMalenovský, Vladimíren
dc.date.created2023cs
dc.description.abstractVrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siete LPCNet. Analyzovali sme vplyv použitia dátových setov zameraných na cieľový jazyk a ich vplyv na kvalitu výsledného zvuku. Pre meranie kvality kódovania reči sme využili hodnotiaci systém WARP-Q. Cieľom našej práce bolo navrhnúť vylepšenie trénovacieho dátového setu a použitie postfilterov pre zlepšenie kvality zvuku. Naše výsledky ukazujú merateľné zlepšenia s využitím malého slovenského dátového setu. Rovnako sme zaznamenali, že využitie dolnopriepustného filteru a filtra zlepšujúceho formanty zlepšilo kvalitu výsledného zvuku.en
dc.description.abstractDuring this work, we focused on replicating and enhancing results by using the neural network LPCNet. We compared audio quality from the pre-trained model and our models trained on smaller datasets, thus reducing training time and improving audio quality. We determined that using a language-specific dataset can produce greater results in that specific language than a big general model. We measured the quality of speech of the pre-trained model and our models using WARPQ ranking score 5.2.4. We also examined possibilities of improving audio quality by filtering output audio using output post-filters and formant-enhancing filters. Our results show measurable improvement in audio quality using the suggested methods.cs
dc.description.markDcs
dc.identifier.citationJOCHMAN, S. Kódování řeči na velmi nízkých bitových rychlostech založené na neuronových sítích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other146269cs
dc.identifier.urihttp://hdl.handle.net/11012/213748
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectLPCNeten
dc.subjectrečový kóderen
dc.subjectkódovanieen
dc.subjectkompresiaen
dc.subjectneurónové sieteen
dc.subjectpredikciaen
dc.subjectvocodéren
dc.subjectfiltrovanieen
dc.subjectLPCNetcs
dc.subjectspeech codercs
dc.subjectcodingcs
dc.subjectcompressioncs
dc.subjectneural networkcs
dc.subjectpredictioncs
dc.subjectvocodercs
dc.subjectfilteringcs
dc.titleKódování řeči na velmi nízkých bitových rychlostech založené na neuronových sítíchen
dc.title.alternativeVery Low Bit-Rate Speech Coding Based on Neural Networkscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-08-21cs
dcterms.modified2023-08-21-11:00:20cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid146269en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 21:00:37en
sync.item.modts2025.01.15 13:53:40en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.12 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_146269.html
Size:
12.29 KB
Format:
Hypertext Markup Language
Description:
file review_146269.html
Collections