Automatický přepis řeči pro česká nářečí

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igorsk
dc.contributor.authorOkrucký, Alexander Rastislavsk
dc.contributor.refereeKarafiát, Martinsk
dc.date.created2025cs
dc.description.abstractTáto práca sa zaoberá procesom transforácie existujúceho archívu českých nárečí do vylepšeného datasetu. Práca zahŕňa sanitizáciu textu, zarovnanie dát pomocou nástroja NeMo Force Aligner a nastrihanie nahrávok na segmenty s dialektologickým prepisom. Tento dataset je pripravený na trénovanie modelov automatického rozpoznávania reči. Práca sa taktiež zaoberá adaptáciou modelu Whisper medium na českých nárečiach. S použitím 10 hodín zvukových záznamov bolo možné znížiť hodnotu Word Error Rate zo 75\% na 46\%. Táto bakalárska práce je súčasťou projektu JaMap, ktorý je zameraný na podporu aplikovaného výzkumu národnej a kultúrnej identity regiónov Českej republiky a metódy strojového učenia potrebné pre zachovanie českých nárečí. Tento projekt je súčasťou programu Ministerstva kultúry Českej republiky na podporu aplikovaného výskumu národnej a kultúrnej identity.sk
dc.description.abstractThis thesis explores the transformation of an existing archive of Czech dialect recordings into an improved dataset. The work includes text sanitization, text alignment using the NeMo Force Aligner, and cutting the recordings into clips with dialectological transcription. This dataset is ready for training automatic speech recognition models. This work also includes adapting the Whisper medium model on Czech dialects. Word Error Rate was improved from 75\% to 46\% by using only 10 hours of audio. This thesis contributes to the JaMap project, focused on linguistic memory of the regions of the Czech Republic and machine learning methods for preserving, documenting, and presenting Czech dialects. The project is part of a program to support applied research in national and cultural identity by the Ministry of Culture of the Czech Republic.en
dc.description.markBcs
dc.identifier.citationOKRUCKÝ, A. Automatický přepis řeči pro česká nářečí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other163233cs
dc.identifier.urihttp://hdl.handle.net/11012/252790
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectčeské nárečiask
dc.subjectzarovnávanie textusk
dc.subjectautomatické rozpoznávanie rečisk
dc.subjectpredspracovanie dátsk
dc.subjectCzech dialectsen
dc.subjecttext alignemnten
dc.subjectautomatic speech recognitionen
dc.subjectdata pre-processingen
dc.titleAutomatický přepis řeči pro česká nářečísk
dc.title.alternativeAutomatic Transcription of Czech Dialectical Speechen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-16cs
dcterms.modified2025-06-16-14:38:36cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid163233en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:03:25en
sync.item.modts2025.08.26 20:12:56en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.26 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_163233.html
Size:
11.87 KB
Format:
Hypertext Markup Language
Description:
file review_163233.html

Collections