Speaker Discrimination Using Long-Term Spectrum of Speech
dc.contributor.author | Sigmund, Milan | cs |
dc.coverage.issue | 3 | cs |
dc.coverage.volume | 48 | cs |
dc.date.accessioned | 2021-09-30T14:56:18Z | |
dc.date.available | 2021-09-30T14:56:18Z | |
dc.date.issued | 2019-09-25 | cs |
dc.description.abstract | In this article, a specific long-term speech spectrum was investigated with respect to its use for speaker recognition. The long-term spectrum was calculated by means of second-order linear prediction using the average autocorrelation coefficients. Four subbands with the most discriminative capability were selected for speaker recognition. These subbands involve the frequencies of 0-1.2 kHz in total. The best recognition rates, i.e. 91.7% on complete speech and 100% on voiced speech, were achieved in optimal paired subbands. | en |
dc.description.abstract | V tomto článku bylo zkoumáno specifické dlouhodobé spektrum řeči s ohledem na jeho využití pro rozpoznávání mluvčích. Dlouhodobé spektrum bylo vypočteno pomocí lineární predikce druhého řádu s použitím průměrných autokorelačních koeficientů. Pro rozpoznávání mluvčích byly vybrány čtyři dílčí pásma s nejvyšší diskriminační schopností. Tato pásma zahrnují celkem frekvence 0-1,2 kHz. V optimálně spárovaných dílčích pásmech bylo dosaženo nejlepší míry rozpoznávání, a sice 91,7% při použití kompletní řeči a 100% při použití znělé řeči. | cs |
dc.format | text | cs |
dc.format.extent | 446-453 | cs |
dc.format.mimetype | application/pdf | cs |
dc.identifier.citation | Information Technology and Control. 2019, vol. 48, issue 3, p. 446-453. | en |
dc.identifier.doi | 10.5755/j01.itc.48.3.21248 | cs |
dc.identifier.issn | 1392-124X | cs |
dc.identifier.other | 159590 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/201688 | |
dc.language.iso | en | cs |
dc.publisher | Kaunas University of Technology | cs |
dc.relation.ispartof | Information Technology and Control | cs |
dc.relation.uri | http://itc.ktu.lt/index.php/ITC/article/view/21248 | cs |
dc.rights | Creative Commons Attribution 4.0 International | cs |
dc.rights.access | openAccess | cs |
dc.rights.sherpa | http://www.sherpa.ac.uk/romeo/issn/1392-124X/ | cs |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | cs |
dc.subject | Speech signal | en |
dc.subject | long-term spectrum | en |
dc.subject | speaker discrimination | en |
dc.subject | efficient features | en |
dc.subject | Řečový signál | |
dc.subject | dlouhodobé spektrum | |
dc.subject | rozpoznávání mluvčích | |
dc.subject | efektivní příznaky | |
dc.title | Speaker Discrimination Using Long-Term Spectrum of Speech | en |
dc.title.alternative | Rozlišování mluvčích pomocí dlouhodobého spektra řeči | cs |
dc.type.driver | article | en |
dc.type.status | Peer-reviewed | en |
dc.type.version | publishedVersion | en |
sync.item.dbid | VAV-159590 | en |
sync.item.dbtype | VAV | en |
sync.item.insts | 2021.09.30 16:56:18 | en |
sync.item.modts | 2021.09.30 16:15:13 | en |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav radioelektroniky | cs |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- 21248Article Text7722511020190925.pdf
- Size:
- 750.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- 21248Article Text7722511020190925.pdf