ASR-YUE-003慧听粤语语音识别数据库

发布日期:2021-06-18

该粤语语音识别数据库V2的采集工作在粤语地区完成,覆盖了广东、香港多个行政区。根据不同地市在粤语方言区中的语言保存面貌及在语言学上数据采集的地位,特将主要录制任务定位在广州、珠海、佛山、中山等粤语口音纯正的地区,以经济发达的城市为主。因此,在数据采集方面能够最大限度地保证数据的多样性、真实性和有效性。

总共采集了700人以上的语音数据,数据总时长超过500小时。所有发音人均是香港、广东本地人,粤语发音纯正,朗读自然流利。男女性别比接近 1:1。

语音采集设备为基于 Android 系统的手机。该数据采样率为 16 kHz,采样精度是 16bit, 为单通道录音,并以 PCM 非压缩文件格式存储。

所有录音数据均在安静的室内完成。

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

该数据库全面展现粤语语音的特色,数据库规模大,数据标注质量高,可用于语音识别系统训练、测试、语音分析、粤语研究等多种用途。

相关数据