ASR-YUE-002慧听粤英混合语音识别数据库

发布日期:2021-06-18

粤英混合语音识别数据库的采集地区是中国香港和广东省,共采集1000人的语音数据。所有发音人均是香港人或广东本地人,粤语发音纯正,朗读自然流利,男女比例均衡,年龄从18~54岁。所有录制内容是粤语英文混合句。

该数据库总有效时长500小时,数据采样率为16kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。

录音采集设备是高端智能手机。

录音环境均为真实场景,分为三类:办公室/宿舍/家、餐厅/咖啡厅、街道。

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

该数据库能够反映粤语区大众水平英语发音的特点,在多种真实场景中录制,采集人数多,语音数据规模大,数据标注质量高,可用于真实场景语音识别系统训练、测试、语音分析、粤英混合发音研究等多种用途。

相关数据