• 该数据库总有效时长3000 小时,数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM 非压缩文件格式存储。 总共采集了3000人的语音数据,所有发音人具有明显口音,朗读自然流利。 男女性别比接近1:1。语音采集设备是智能手机,采用基于Android 系统的多种品牌型号手机录制; 录音环境有室内、室外多种真实场景。录音数据与文本均由标注团队成员细心校对,句错误率低于2%。
  • 中英混合语音识别数据库在国内多个省市完成录制,共采集2000人的语音数据。发音人来自中国多个方言地区,男女比例均衡,年龄从18~65岁,发音自然流利。所有录制内容是中英文混合句,其中的中文部分用普通话发音。
  • 近场命令词语音识别数据库总共采集了350人的语音数据。录音人群年龄分布为4岁~75岁,录音人口音覆盖北方官话、西南官话、粤语、吴语、闽语、赣语、湘语几大方言区,且录音人性别比均衡、发音自然流利。
  • 轻口音普通话语音识别数据库在北方地区完成语音采集工作。该数据库总有效时长200小时,数据采样率为16 kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。