• 该数据库共采集1000人的语音数据,总有效时长500小时,数据采样率为16kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。 录音环境均为真实场景,分为三类:办公室/宿舍/家、餐厅/咖啡厅、街道。
  • 总共采集了700人以上的语音数据,数据总时长超过500小时。所有发音人均是香港、广东本地人,粤语发音纯正,朗读自然流利。男女性别比接近 1:1。 语音采集设备为基于 Android 系统的手机。该数据采样率为 16 kHz,采样精度是 16bit, 为单通道录音,并以 PCM 非压缩文件格式存储。
  • 总共采集了800人以上的语音数据,数据总时长超过500小时。所有发音人均是香港、广东本地人,粤语发音纯正,朗读自然流利。男女性别比接近 1:1。 语音采集设备为基于 Android、IOS 系统的手机。该数据采样率为 16 kHz,采样精度是 16bit, 为单通道录音,并以 PCM 非压缩文件格式存储。
  • 该库总共采集了190人以上的语音数据,数据总时长为120小时。所有发音人均是香港本地人,粤语发音纯正,朗读自然流利。男女性别比为 1:1。 语音采集设备为基于 Android、IOS 系统的手机。该数据采样率为 16 kHz,采样精度是 16bit, 为单通道录音,并以 PCM 非压缩文件格式存储。