ASR-CMN-002-v2慧听中英混合语音识别数据库

发布日期:2021-06-18

中英混合语音识别数据库在国内多个省市完成录制,已采集3000人以上的语音数据。发音人来自中国多个省份和直辖市,男女比例均衡,发音自然流利。所有录制内容是中英文混合句,其中的中文部分用普通话发音。

具体采集地区有:黑龙江、吉林、辽宁、内蒙古、北京、天津、河北、河南、山东、山西、陕西、宁夏、甘肃、新疆、四川、重庆、安徽、上海、江苏、浙江、湖北、湖南、江西、广东、广西、福建、云南、贵州、海南等。

该数据库总有效时长2000小时,数据采样率为16kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。

录音采集设备是智能手机。

录音环境均为相对安静的室内。

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

该数据库能够反映中国各地大众水平英语发音的特点,在多种真实场景中录制,采集人数多,语音数据规模大,数据标注质量高,可用于真实场景语音识别系统训练、测试、语音分析、中英混合发音研究等多种用途。

相关数据