Odezírání ze rtů pomocí hlubokých neuronových sítí

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. Martin Čadík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Jak velký slovník jste měl k dispozici? Jaký je Váš hlavní přínos? Co si myslíte o vysoké chybovosti, které jste dosáhl? Jak si Vaše metoda stojí v porovnání s existujícími řešeními?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorKadleček, Josefcs
dc.contributor.refereeKišš, Martincs
dc.date.created2019cs
dc.description.abstractTato práce se zabývá současnými metodami pro přepis řeči na text a odezírání ze rtů za pomoci neuronových sítí. Následně se zabývá podobností architektur neuronových sítí operujících nad zvukem a videem při rozpoznávání řeči a porovnává dostupné audiovizuální datové sady. Výsledkem práce je sada experimentů porovnávající různé zásahy do modelu a jejich dopad na výsledky. Dále je součástí implementace systému pro přepis řeči (CER: 12.6 %) a pro odezírání ze rtů (CER: 57,7 %). Architektury obou systémů jsou založeny na extrakci příznaků pomocí konvolučních vrstev. Za nimi následují rekurentní vrstvy LSTM, další řada konvolučních vrstev a hodnotící funkce CTC.cs
dc.description.abstractThis thesis deals with current methods for automatic speech recognition and lip reading via neural networks. Furthermore it deals with similarities in the architectures of neural networks for audio and visual data and available datasets in the field of audiovisual automatic speech recognition. The main contribution of this thesis is set of experiments comparing different changes in neural network architecture and its impact on results. The thesis includes an implementation of a system for automatic speech recognition from audio (CER: 12.6 %) and visual (CER: 57,7 %) data. The architectures of both systems are based on features extraction via convolutional networks followed by recurrent layers LSTM, another layer of convolutions and loss function CTC.en
dc.description.markBcs
dc.identifier.citationKADLEČEK, J. Odezírání ze rtů pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122043cs
dc.identifier.urihttp://hdl.handle.net/11012/180194
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectOdezírání ze rtůcs
dc.subjectpřepis řečics
dc.subjectneuronové sítěcs
dc.subjectrekurentní neuronové sítěcs
dc.subjectkonvolucecs
dc.subjectpočítačové viděnícs
dc.subjectsekvence na sekvencics
dc.subjectEnkodér-Dekodércs
dc.subjectCTCcs
dc.subjectPyTorchcs
dc.subjectPython.cs
dc.subjectLip readingen
dc.subjectspeech recognitionen
dc.subjectneural networksen
dc.subjectrecurrent neural networken
dc.subjectconvolutionen
dc.subjectcomputer visionen
dc.subjectsequence to sequenceen
dc.subjectEncoder-Decoderen
dc.subjectCTCen
dc.subjectPyTorchen
dc.subjectPython.en
dc.titleOdezírání ze rtů pomocí hlubokých neuronových sítícs
dc.title.alternativeConvolutional Networks for Lip Readingen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-11cs
dcterms.modified2019-07-08-13:31:24cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122043en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:24:23en
sync.item.modts2025.01.15 17:53:10en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.43 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21772_v.pdf
Size:
85.99 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21772_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21772_o.pdf
Size:
87.12 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21772_o.pdf
Loading...
Thumbnail Image
Name:
review_122043.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_122043.html
Collections