BUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komoře

Loading...
Thumbnail Image
Date
2018-04-30
ORCID
Advisor
Referee
Mark
Journal Title
Journal ISSN
Volume Title
Publisher
International Society for Science and Engineering, o.s.
Abstract
Tento článek popisuje databázi nahrávek lidského hlasu BUT-CZAS (Brno University of Technology, Czech Anechoic Speech), pořízených v bezodrazové komoře Vysokého učení technického v Brně. Databáze obsahuje celkem 405 mono nahrávek čteného českého textu s bitovou hloubkou 24 bitů a vzorkovací frekvencí 48 kHz. Nahráváno bylo celkem 18 různých řečníků (9 žen a 9 mužů) ve věku od 16 do 76 let. Celková délka všech nahrávek je 315 minut. V nahrávkách dohromady zaznělo více než 40 tisíc verzí 1711 unikátních slov. Při nahrávání byl kladen důraz především na dodržení stejných podmínek nahrávání ve vysoké kvalitě a na vyváženost zástupců všech skupin pohlaví a věku. Ke všem nahrávkám je k dispozici přepis nahraného textu.
The paper introduces a novel database of human voice recordings named BUT-CZAS (Brno University of Technology, Czech Anechoic Speech), acquired in the anechoic chamber. The database consists of 405 mono recordings of the reading task in the Czech language acquired using bit depth of 24 bit and sampling rate of 48 kHz. In total, 18 speakers (9 women, 9 men) aged between 16–76 years old were involved in the process. Total duration of all recordings is approximately 315 min (comprising more than 40 000 versions of 1 747 unique words). The database is designed with particular emphasis on the recording environment, quality of the recordings and equality of both age and gender groups. The full transcript is available for all the recordings.
Description
Keywords
Citation
Elektrorevue. 2018, vol. 20, č. 2, s. 48-52. ISSN 1213-1539
http://www.elektrorevue.cz/
Document type
Peer-reviewed
Document version
Published version
Date of access to the full text
Language of document
cs
Study field
Comittee
Date of acceptance
Defence
Result of defence
Document licence
(C) 2018 Elektrorevue
DOI
Collections
Citace PRO