ASR-CMD-001慧听远场命令词语音识别数据库

发布日期:2021-06-18

远场命令词语音识别数据库总共采集了200人的语音数据。录音人群年龄分布17岁~32岁,来自于全国25个省区直辖市,性别比均衡、发音自然流利。

 

录音文本为固定的600条中文命令词,包含智能家电语句、唤醒语句、车载语句等。

 

同时采集5路语音信号:麦克风阵列3路(距离发音人嘴部50cm)、耳麦1路、智能手机单声道1路,录音设备及音频格式如下:

 

录音设备

音频格式

备注

多通道录音机

著名品牌高保真麦克

48kHz,16bit,4声道,无压缩wav

定位于发音人嘴边1路、正前方50cm处麦克风阵列3路

智能手机

16kHz,16bit,单声道,无压缩wav

手持

 

所有录音数据均在安静、无回声的室内完成。

 

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。

 

该数据库包含各种命令词发音,数据库规模大,数据标注质量高,可用于车载、智能家电语音识别系统训练、测试等多种用途。

相关数据