ASR-CMD-001慧听远场命令词语音识别数据库
发布日期:2021-06-18
远场命令词语音识别数据库总共采集了200人的语音数据。录音人群年龄分布17岁~32岁,来自于全国25个省区直辖市,性别比均衡、发音自然流利。
录音文本为固定的600条中文命令词,包含智能家电语句、唤醒语句、车载语句等。
同时采集5路语音信号:麦克风阵列3路(距离发音人嘴部50cm)、耳麦1路、智能手机单声道1路,录音设备及音频格式如下:
录音设备 |
音频格式 |
备注 |
多通道录音机 著名品牌高保真麦克 |
48kHz,16bit,4声道,无压缩wav |
定位于发音人嘴边1路、正前方50cm处麦克风阵列3路 |
智能手机 |
16kHz,16bit,单声道,无压缩wav |
手持 |
所有录音数据均在安静、无回声的室内完成。
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。
该数据库包含各种命令词发音,数据库规模大,数据标注质量高,可用于车载、智能家电语音识别系统训练、测试等多种用途。
相关数据
-
评价:{{item.assess}}