ASR-CMD-002慧听近场命令词语音识别数据库
发布日期:2021-06-18
近场命令词语音识别数据库总共采集了350人的语音数据。录音人群年龄分布为4岁~75岁,录音人口音覆盖北方官话、西南官话、粤语、吴语、闽语、赣语、湘语几大方言区,且录音人性别比均衡、发音自然流利。
录音文本包含命令短语、普通短语、日常短句等。
同时采集2路语音信号:桌面麦克风及智能手机,录音设备及音频格式如下:
录音设备 |
音频格式 |
备注 |
桌面麦克风 |
48kHz,16bit,单声道,无压缩wav |
距嘴20-30cm |
智能手机 |
16kHz,16bit,单声道,无压缩wav |
四种品牌共7个型号 |
所有录音数据均在安静、无回声的室内完成。
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。
近场命令词数据库录音人年龄及口音分布广泛,数据标注质量高,可用于声纹识别、语音测试、语音识别等多种用途。
相关数据
-
评价:{{item.assess}}