ASR-CMN-004慧听儿童中文普通话语音识别数据库

发布日期:2021-06-18

儿童中文普通话语音数据识别数据库在国内多地开展录音采集,完成总人数1500人以上。

该数据库总有效时长1000小时。发音人覆盖中国华北、华南、华东、华中、西北、东北、西南7大地区,年龄覆盖5-12岁,男女比例均衡。

考虑到儿童语音识别的市场应用需求,录音的文本语料主要从口语、儿童命令语句、儿童故事等领域选取。

录音环境是相对安静的室内。采用的录音设备是高端智能手机,数据的规格为16kHz、16bit、MONO,非压缩PCM格式存储。

该数据库录音人数多、覆盖儿童各年龄段、发音内容符合儿童语音识别应用需求,可用于中文语音识别系统训练、测试、语音分析、儿童发音研究等多种用途。

相关数据