BUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komoře

dc.contributor.authorHájek, Vojtěch
dc.contributor.authorHarár, Pavol
dc.contributor.authorSchimmel, Jiří
dc.contributor.authorBurget, Radim
dc.coverage.issue2cs
dc.coverage.volume20cs
dc.date.accessioned2023-10-09T07:56:08Z
dc.date.available2023-10-09T07:56:08Z
dc.date.issued2018-04-30cs
dc.description.abstractTento článek popisuje databázi nahrávek lidského hlasu BUT-CZAS (Brno University of Technology, Czech Anechoic Speech), pořízených v bezodrazové komoře Vysokého učení technického v Brně. Databáze obsahuje celkem 405 mono nahrávek čteného českého textu s bitovou hloubkou 24 bitů a vzorkovací frekvencí 48 kHz. Nahráváno bylo celkem 18 různých řečníků (9 žen a 9 mužů) ve věku od 16 do 76 let. Celková délka všech nahrávek je 315 minut. V nahrávkách dohromady zaznělo více než 40 tisíc verzí 1711 unikátních slov. Při nahrávání byl kladen důraz především na dodržení stejných podmínek nahrávání ve vysoké kvalitě a na vyváženost zástupců všech skupin pohlaví a věku. Ke všem nahrávkám je k dispozici přepis nahraného textu.cs
dc.description.abstractThe paper introduces a novel database of human voice recordings named BUT-CZAS (Brno University of Technology, Czech Anechoic Speech), acquired in the anechoic chamber. The database consists of 405 mono recordings of the reading task in the Czech language acquired using bit depth of 24 bit and sampling rate of 48 kHz. In total, 18 speakers (9 women, 9 men) aged between 16–76 years old were involved in the process. Total duration of all recordings is approximately 315 min (comprising more than 40 000 versions of 1 747 unique words). The database is designed with particular emphasis on the recording environment, quality of the recordings and equality of both age and gender groups. The full transcript is available for all the recordings.en
dc.formattextcs
dc.format.extent48-52cs
dc.format.mimetypeapplication/pdfen
dc.identifier.citationElektrorevue. 2018, vol. 20, č. 2, s. 48-52. ISSN 1213-1539cs
dc.identifier.issn1213-1539
dc.identifier.urihttp://hdl.handle.net/11012/214230
dc.language.isocscs
dc.publisherInternational Society for Science and Engineering, o.s.cs
dc.relation.ispartofElektrorevuecs
dc.relation.urihttp://www.elektrorevue.cz/cs
dc.rights(C) 2018 Elektrorevueen
dc.rights.accessopenAccessen
dc.titleBUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komořecs
dc.title.alternativeBUT-CZAS: Corpus of high-quality Czech speech recordings acquired in the anechoic chamberen
dc.type.driverarticleen
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
clanek_08_30.04.2018.pdf
Size:
1.11 MB
Format:
Adobe Portable Document Format
Description:
Collections