Evaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníka
but.committee | prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: You propose a Modified DCF metric and Time Constrained Protocol. Do you think they are interchangeable or there are tasks when one should be preferred over the other? If yes, give an example. In your work, you present two approaches to truncate the input utterances to reduce the processing time (A and B as referenced in the text). How do you think, what are the reasons for the approach B (limiting the number of speech frames for x-vector extraction) to outperform A (simply truncating the audio)? Have you considered other strategies to reduce the processing time except for those two described in the thesis? If yes, what were they and what advantages and disadvantages they have compared to those that you've used? Kolik metod na rozpoznávání řeči jste použila? Dávaly by vámi použité metriky smysl i pro jinou metodu rozpoznávání řeči? | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Rohdin, Johan Andréas | en |
dc.contributor.author | Gregušová, Sabína | en |
dc.contributor.referee | Silnova, Anna | en |
dc.date.created | 2020 | cs |
dc.description.abstract | Cieľom tejto práce je navrhnúť hodnotiacu metriku, ktorá zahŕňa výpočetné náklady. Všeobecne výpočetné náklady nepredstavujú vo výskume problém, ale môžu byť problematické v komerčnom produkčnom systéme, kedy je rýchlosť dôležitá. Navrhnuté metriky rozširujú existujúci rámec pre hodnotenie od NIST a pridávajú k nim parametre pre časovú jednotku a náklady pre časovú jednotku. Tieto metriky sú aplikované na skutočný ASV a experimenty ukazujú potenciál pre hlbší výskum a možné použitie. Vrámci experimentov bola limitovaná maximálna dĺžka nahrávok, ale aj maximálne dĺžka rámcov pre spracovanie pri extrakcii x-vektorov. Obe optimalizácie znížili celkové výpočetné náklady a dosiahli priaznivé výsledky pre nové metriky. Na záver sú výsledky z experimentov porovnané a jednotlivé modifikácie ohodnotené a zoradené podľa nových metrík. | en |
dc.description.abstract | The goal of this thesis is to propose an evaluation metric that includes computational costs. Computational costs generally do not pose a problem in research, but it can become problematic in a commercial production system, where speed is essential. The proposed metric extends existing evaluation framework from NIST and adds parameter for time unit and time unit cost. These metrics are applied on real ASV and experiments show the potential for further research and possible use. The experiments focus on reducing the computational cost by posing a limit on maximum length of the utterance, but also limiting number of frames for x-vector extraction. Both optimizations reduced the computational costs and reached favorable results for the new metrics. Finally, experiments' results are compared and each system modification is ranked according to the new metrics. | cs |
dc.description.mark | C | cs |
dc.identifier.citation | GREGUŠOVÁ, S. Evaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020. | cs |
dc.identifier.other | 129157 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/191517 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávanie rečníka | en |
dc.subject | evaluácia systémov na rospoznávanie rečníka | en |
dc.subject | optimalizácia systémov na rozpoznanie rečníka | en |
dc.subject | výpočetné náklady | en |
dc.subject | evaluačné metriky | en |
dc.subject | speaker recognition systems | cs |
dc.subject | speaker recognition evaluation | cs |
dc.subject | speaker recognition optimization | cs |
dc.subject | computational costs | cs |
dc.subject | evaluation metrics | cs |
dc.title | Evaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníka | en |
dc.title.alternative | Evaluation and Optimization of Computational Costs in Speaker Recognition Systems | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2020-07-10 | cs |
dcterms.modified | 2020-07-13-23:41:08 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 129157 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:30:09 | en |
sync.item.modts | 2025.01.15 11:35:04 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.26 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23008_v.pdf
- Size:
- 85.7 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-23008_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23008_o.pdf
- Size:
- 91.25 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-23008_o.pdf
Loading...
- Name:
- review_129157.html
- Size:
- 1.49 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_129157.html