Automatický přepis řeči pro česká nářečí
| but.committee | prof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
| but.jazyk | slovenština (Slovak) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Szőke, Igor | sk |
| dc.contributor.author | Okrucký, Alexander Rastislav | sk |
| dc.contributor.referee | Karafiát, Martin | sk |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Táto práca sa zaoberá procesom transforácie existujúceho archívu českých nárečí do vylepšeného datasetu. Práca zahŕňa sanitizáciu textu, zarovnanie dát pomocou nástroja NeMo Force Aligner a nastrihanie nahrávok na segmenty s dialektologickým prepisom. Tento dataset je pripravený na trénovanie modelov automatického rozpoznávania reči. Práca sa taktiež zaoberá adaptáciou modelu Whisper medium na českých nárečiach. S použitím 10 hodín zvukových záznamov bolo možné znížiť hodnotu Word Error Rate zo 75\% na 46\%. Táto bakalárska práce je súčasťou projektu JaMap, ktorý je zameraný na podporu aplikovaného výzkumu národnej a kultúrnej identity regiónov Českej republiky a metódy strojového učenia potrebné pre zachovanie českých nárečí. Tento projekt je súčasťou programu Ministerstva kultúry Českej republiky na podporu aplikovaného výskumu národnej a kultúrnej identity. | sk |
| dc.description.abstract | This thesis explores the transformation of an existing archive of Czech dialect recordings into an improved dataset. The work includes text sanitization, text alignment using the NeMo Force Aligner, and cutting the recordings into clips with dialectological transcription. This dataset is ready for training automatic speech recognition models. This work also includes adapting the Whisper medium model on Czech dialects. Word Error Rate was improved from 75\% to 46\% by using only 10 hours of audio. This thesis contributes to the JaMap project, focused on linguistic memory of the regions of the Czech Republic and machine learning methods for preserving, documenting, and presenting Czech dialects. The project is part of a program to support applied research in national and cultural identity by the Ministry of Culture of the Czech Republic. | en |
| dc.description.mark | B | cs |
| dc.identifier.citation | OKRUCKÝ, A. Automatický přepis řeči pro česká nářečí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 163233 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/252790 | |
| dc.language.iso | sk | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | české nárečia | sk |
| dc.subject | zarovnávanie textu | sk |
| dc.subject | automatické rozpoznávanie reči | sk |
| dc.subject | predspracovanie dát | sk |
| dc.subject | Czech dialects | en |
| dc.subject | text alignemnt | en |
| dc.subject | automatic speech recognition | en |
| dc.subject | data pre-processing | en |
| dc.title | Automatický přepis řeči pro česká nářečí | sk |
| dc.title.alternative | Automatic Transcription of Czech Dialectical Speech | en |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-16 | cs |
| dcterms.modified | 2025-06-16-14:38:36 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 163233 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:03:25 | en |
| sync.item.modts | 2025.08.26 20:12:56 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
