ASR-CMN-002-v1慧听中英混合语音识别数据库

发布日期:2021-06-18

中英混合语音识别数据库在国内多个省市完成录制，共采集2000人的语音数据。发音人来自中国多个方言地区，男女比例均衡，年龄从18～65岁，发音自然流利。所有录制内容是中英文混合句，其中的中文部分用普通话发音。

具体采集地区如下表：

该数据库总有效时长1000小时，数据采样率为16kHz，采样精度是16bit，为单通道录音，并以PCM非压缩文件格式存储。

录音采集设备是高端智能手机。

录音环境均为真实场景，分为三类：办公室/宿舍/家、餐厅/咖啡厅、街道。

全部录音数据与录音文本均由标注团队成员细心校对，保证句错误率低于5%。

该数据库能够反映中国各地大众水平英语发音的特点，在多种真实场景中录制，采集人数多，语音数据规模大，数据标注质量高，可用于真实场景语音识别系统训练、测试、语音分析、中英混合发音研究等多种用途。