Speaker Discrimination Using Long-Term Spectrum of Speech

dc.contributor.authorSigmund, Milancs
dc.coverage.issue3cs
dc.coverage.volume48cs
dc.date.accessioned2021-09-30T14:56:18Z
dc.date.available2021-09-30T14:56:18Z
dc.date.issued2019-09-25cs
dc.description.abstractIn this article, a specific long-term speech spectrum was investigated with respect to its use for speaker recognition. The long-term spectrum was calculated by means of second-order linear prediction using the average autocorrelation coefficients. Four subbands with the most discriminative capability were selected for speaker recognition. These subbands involve the frequencies of 0-1.2 kHz in total. The best recognition rates, i.e. 91.7% on complete speech and 100% on voiced speech, were achieved in optimal paired subbands.en
dc.description.abstractV tomto článku bylo zkoumáno specifické dlouhodobé spektrum řeči s ohledem na jeho využití pro rozpoznávání mluvčích. Dlouhodobé spektrum bylo vypočteno pomocí lineární predikce druhého řádu s použitím průměrných autokorelačních koeficientů. Pro rozpoznávání mluvčích byly vybrány čtyři dílčí pásma s nejvyšší diskriminační schopností. Tato pásma zahrnují celkem frekvence 0-1,2 kHz. V optimálně spárovaných dílčích pásmech bylo dosaženo nejlepší míry rozpoznávání, a sice 91,7% při použití kompletní řeči a 100% při použití znělé řeči.cs
dc.formattextcs
dc.format.extent446-453cs
dc.format.mimetypeapplication/pdfcs
dc.identifier.citationInformation Technology and Control. 2019, vol. 48, issue 3, p. 446-453.en
dc.identifier.doi10.5755/j01.itc.48.3.21248cs
dc.identifier.issn1392-124Xcs
dc.identifier.other159590cs
dc.identifier.urihttp://hdl.handle.net/11012/201688
dc.language.isoencs
dc.publisherKaunas University of Technologycs
dc.relation.ispartofInformation Technology and Controlcs
dc.relation.urihttp://itc.ktu.lt/index.php/ITC/article/view/21248cs
dc.rightsCreative Commons Attribution 4.0 Internationalcs
dc.rights.accessopenAccesscs
dc.rights.sherpahttp://www.sherpa.ac.uk/romeo/issn/1392-124X/cs
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/cs
dc.subjectSpeech signalen
dc.subjectlong-term spectrumen
dc.subjectspeaker discriminationen
dc.subjectefficient featuresen
dc.subjectŘečový signál
dc.subjectdlouhodobé spektrum
dc.subjectrozpoznávání mluvčích
dc.subjectefektivní příznaky
dc.titleSpeaker Discrimination Using Long-Term Spectrum of Speechen
dc.title.alternativeRozlišování mluvčích pomocí dlouhodobého spektra řečics
dc.type.driverarticleen
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen
sync.item.dbidVAV-159590en
sync.item.dbtypeVAVen
sync.item.insts2021.09.30 16:56:18en
sync.item.modts2021.09.30 16:15:13en
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav radioelektronikycs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
21248Article Text7722511020190925.pdf
Size:
750.07 KB
Format:
Adobe Portable Document Format
Description:
21248Article Text7722511020190925.pdf