美式英语语音识别数据库1500小时

发布日期:2019-01-23

美式英语音识别数据库在美国进行语音采集工作。所有发音人的母语均为美语,发音自然流利,口语典型。总共完成1400人共计1500小时的语音数据,发音人男女比例均衡,年龄覆盖18-60岁。

录音的设备是高性能桌面麦克风与高端智能手机,在相对安静的室内使用这两种设备同步采集。

该数据库录音数据的规格是:手机数据16kHz、16bit、MONO,桌面麦克风数据48kHz、16bit、MONO,均以非压缩PCM格式存储。

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

该数据库录音人数多、年龄覆盖广泛、数据标注质量高,可用于美式英语语音识别系统训练、测试、语音分析、发音研究等多种用途。

相关数据