ASR-BOD-001慧听藏语语音识别数据库
发布日期:2021-06-18
藏语语音识别数据库总有效时长900小时,数据采样率为16 kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。
总共采集了700人 以上的语音数据,所有发音人均以藏语为母语,发音自然流利。全面覆盖藏语三种口音:安多、卫藏、康巴。
语音采集设备是智能手机,采用基于Android系统的多种品牌型号手机进行录制;
录音环境为一般安静室内。
全部录音数据与录音文本均由母语为藏语的校对人员细心校对,保证句错误率低于5%。
该数据库从藏语区多个城市地区采集,口音覆盖全面。数据库规模大,数据标注质量高,可用于语音识别系统训练、测试、语音分析、藏语研究等多种用途。
相关数据
-
评价:{{item.assess}}