Adaptace rozpoznávače řeči na datech bez přepisu

Loading...
Thumbnail Image

Date

Authors

Švec, Ján

Mark

E

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.
The goal of this thesis is to design and test techniques for unsupervised adaptation of speech recognizers on some audio data without any textual transcripts. A training set is prepared at first, and a baseline speech recognition system is trained. This sistem is used to transcribe some unseen data. We will experiment with an adaptation data selection process based on some speech transcript quality measurement. The system is re-trained on this new set than, and the accuracy is evaluated. Then we experiment with the amount of adaptation data.

Description

Citation

ŠVEC, J. Adaptace rozpoznávače řeči na datech bez přepisu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Počítačová grafika a multimédia

Comittee

doc. RNDr. Pavel Smrž, Ph.D. (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Petr Sedlák, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen)

Date of acceptance

2015-06-25

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: V textu se zmiňujete velké množství externích zdrojů (titulky, web...) pro tvorbu jazykového modelu. Byly tyto data přidány k původním přepisům se stejnou váhou, nebo byla tvorba jazykového modelu optimalizována? Jak se změní úspěšnost pokud zadaptujete již adaptovaný systém.  Myslíte že způsob jakým je měřena věrohodnost ("confidence") je plně dostačující nebo by šel nadále vylepšit.Pokud ano, jaký způsob by jste navrhoval.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO