ASR-CMD-003慧听唤醒词语音识别数据库

发布日期:2021-06-18

唤醒词语音识别数据库总共采集了710人的语音数据。录音人群年龄分布为4岁~80岁。录音人性别比均衡、发音自然流利。

 

同时采集2路语音信号:桌面麦克风及智能手机,录音设备及音频格式如下:

 

录音设备

音频格式

备注

桌面麦克风

48kHz,16bit,单声道,无压缩wav

距嘴20-30cm

智能手机

16kHz,16bit,单声道,无压缩wav

 

 

该数据库由三个子库构成,每个子库的录音文本不同,发音人不同。明细见下表:

 

唤醒库

录音文本

年龄段

人数

备注

A

14个词*20遍

4-80岁

200人

4-5岁40人,6-10岁40人,11-18岁40人,60+岁30人

B

20个短句*20遍

成年人

200人

 

C

18个词*10遍

成年人

60人

20词文本是在18词文本基础上增加2词

20个词*10遍

成年人

250人

 

所有录音数据均在安静、无回声的室内完成。

 

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

 

唤醒词语音识别数据库录音人年龄分布广泛,数据标注质量高,可用于声纹识别、语音测试、语音识别等多种用途。

相关数据