• 该数据库总有效时长800小时。发音人覆盖中国华北、华南、华东、华中、西北、东北、西南7大地区,年龄覆盖5-12岁,男女比例均衡。
  • 该数据库总有效时长800小时。发音人覆盖中国华北、华南、华东、华中、西北、东北、西南7大地区,年龄覆盖60-80岁,男女比例均衡。
  • 该数据库总有效时长3000 小时,数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM 非压缩文件格式存储。 总共采集了3000人的语音数据,所有发音人具有明显口音,朗读自然流利。 男女性别比接近1:1。语音采集设备是智能手机,采用基于Android 系统的多种品牌型号手机录制; 录音环境有室内、室外多种真实场景。录音数据与文本均由标注团队成员细心校对,句错误率低于2%。
  • 中英混合语音识别数据库在国内多个省市完成录制,共采集2000人的语音数据。发音人来自中国多个方言地区,男女比例均衡,年龄从18~65岁,发音自然流利。所有录制内容是中英文混合句,其中的中文部分用普通话发音。