ASR-CMD-003慧听唤醒词语音识别数据库
发布日期:2021-06-18
唤醒词语音识别数据库总共采集了710人的语音数据。录音人群年龄分布为4岁~80岁。录音人性别比均衡、发音自然流利。
同时采集2路语音信号:桌面麦克风及智能手机,录音设备及音频格式如下:
录音设备 |
音频格式 |
备注 |
桌面麦克风 |
48kHz,16bit,单声道,无压缩wav |
距嘴20-30cm |
智能手机 |
16kHz,16bit,单声道,无压缩wav |
|
该数据库由三个子库构成,每个子库的录音文本不同,发音人不同。明细见下表:
唤醒库 |
录音文本 |
年龄段 |
人数 |
备注 |
A |
14个词*20遍 |
4-80岁 |
200人 |
4-5岁40人,6-10岁40人,11-18岁40人,60+岁30人 |
B |
20个短句*20遍 |
成年人 |
200人 |
|
C |
18个词*10遍 |
成年人 |
60人 |
20词文本是在18词文本基础上增加2词 |
20个词*10遍 |
成年人 |
250人 |
所有录音数据均在安静、无回声的室内完成。
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。
唤醒词语音识别数据库录音人年龄分布广泛,数据标注质量高,可用于声纹识别、语音测试、语音识别等多种用途。
相关数据
-
评价:{{item.assess}}