Automatický přepis řeči s podporou code switching
but.committee | prof. Dr. Ing. Jan Černocký (předseda) Ing. Ondřej Lengál, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. Radim Kocman, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Oponent hodnotil práci stupněm 4F, protože zadání bylo splněno pouze částečně a technická zpráva obsahuje zásadní nedostatky neodpovídající standardům FIT pro bakalářskou práci. Student nedokázal vyvrátit výtky oponenta. Komise shledala nedostatky práce natolik závažné, že se práci rozhodla hodnotit jako nevyhovující. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce nebyla úspěšně obhájena | cs |
dc.contributor.advisor | Szőke, Igor | cs |
dc.contributor.author | Bílek, Štěpán | cs |
dc.contributor.referee | Karafiát, Martin | cs |
dc.date.created | 2024 | cs |
dc.description.abstract | Tato práce se zabývá problematikou automatického rozpoznávání řeči. Zaměřuje se na rozpoznávání audia obsahující vícejazyčné promluvy, tzv. code-switching. Problém nedostatku vícejazyčných dat pro trénování je řešen kombinováním nahrávek v angličtině a němčině dohromady. Pro co největší přiblížení ke skutečné dvojjazyčné řeči je část datasetů tvořena spojováním nahrávek podobných mluvčích. Na vytvořených datech je trénován a testován model Whisper. Ten v původní neadaptované verzi dosahuje chybovosti až 70 %. Nejlepší modely trénované na kombinovaných datasetech dosahují chybovosti jen lehce přes 7 %. Výsledky této práce ukazují způsoby jak modely trénovat, aby dosahovaly co nejlepších výsledků. | cs |
dc.description.abstract | This thesis addresses the issue of automatic speech recognition, focusing on the recognition of audio containing multilingual speech, known as code-switching. The problem of a lack of multilingual data for training is addressed by combining recordings in English and German. To achieve the closest approximation to real bilingual speech, a portion of the datasets is created by merging recordings of similar speakers. The Whisper model is trained and tested on the created data. In its original unadapted version, the model achieves an error rate of up to 70 %. The best models trained on combined datasets achieve error rates slightly above 7 %. The results of this study demonstrate methods for training models to achieve the best possible performance. | en |
dc.description.mark | F | cs |
dc.identifier.citation | BÍLEK, Š. Automatický přepis řeči s podporou code switching [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 156791 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247497 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Automatické rozpoznávání řeči | cs |
dc.subject | strojové učení | cs |
dc.subject | Whisper | cs |
dc.subject | code switching | cs |
dc.subject | fine-tuning | cs |
dc.subject | vícejazyčná řeč | cs |
dc.subject | Automatic speech recognition | en |
dc.subject | machine learning | en |
dc.subject | Whisper | en |
dc.subject | code switching | en |
dc.subject | fine-tuning | en |
dc.subject | multilingual speech. | en |
dc.title | Automatický přepis řeči s podporou code switching | cs |
dc.title.alternative | Automatic Transcription of Speech Supporting Code Switching | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-12 | cs |
dcterms.modified | 2024-11-12-15:55:56 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 156791 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:36 | en |
sync.item.modts | 2025.01.16 00:15:01 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |