ASR-CMD-002慧听近场命令词语音识别数据库

发布日期:2021-06-18

近场命令词语音识别数据库总共采集了350人的语音数据。录音人群年龄分布为4岁~75岁,录音人口音覆盖北方官话、西南官话、粤语、吴语、闽语、赣语、湘语几大方言区,且录音人性别比均衡、发音自然流利。

 

录音文本包含命令短语、普通短语、日常短句等。

 

同时采集2路语音信号:桌面麦克风及智能手机,录音设备及音频格式如下:

 

录音设备

音频格式

备注

桌面麦克风

48kHz,16bit,单声道,无压缩wav

距嘴20-30cm

智能手机

16kHz,16bit,单声道,无压缩wav

四种品牌共7个型号

 

所有录音数据均在安静、无回声的室内完成。

 

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

 

近场命令词数据库录音人年龄及口音分布广泛,数据标注质量高,可用于声纹识别、语音测试、语音识别等多种用途。

相关数据