ASR-CMN-020慧听客家话语音识别数据库
发布日期:2024-04-10
广东客家话语音识别数据库正在制作过程中,已完成超过800人的语音采集,累计采集时长超过400小时。
该库在广东省梅州市、惠州市、河源市等地区开展语音采集工作。
该数据库男女比例均衡。所有发音人可以说地道客家话,发音自然流利。
语音采集设备是智能手机,采用多种品牌型号的智能手机进行录制。
录音环境以室内录制为主。
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。
该数据库用地道客家话录制,录音质量好,数据标注质量高,可用于语音识别系统训练、测试、语音分析、方言研究等多种用途。
相关数据
-
评价:{{item.assess}}