河南东北方言语音识别数据库2000小时
发布日期:2015-09-28
方言数据库目前包含东北、河南两种方言,在东北三省、河南省完成语音采集工作。方言数据库的语种、时长、人数信息如下:
录制地区 |
录制语种 |
每地区数据库时长 |
每地区 录制人数 |
东北地区(东北三省) |
东北方言 |
1000小时 |
2000人 |
河南省 |
河南方言 |
1000小时 |
2000人 |
合计 |
2000小时 |
4000人 |
该数据库总有效时长2000小时,数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。
总共采集了4000人的语音数据,所有发音人可以说地道方言,朗读自然流利。
录音环境以室内录制为主。语音采集设备是智能手机,采用基于Android系统的多种品牌型号手机进行录制;
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。
该数据库覆盖方言区内的主要城市,数据库规模大,数据标注质量高,可用于语音识别系统训练、测试、语音分析、口音研究等多种用途。