• 慧听科技参与编制两项国家标准获得批准发布
  • 慧听数据参展2017年ICASSP会议
  • 2016年9月8至12日,第17届“Interspeech 2016”会议在美国加利福尼亚州旧金山市举行,慧听数据作为大会的参展商 参加了本次会议。
  • 慧听科技冠名赞助北京语言大学【玩乐·慧听】西乐专场音乐会
  • 慧听数据参展2016年ICASSP会议
  • “慧听中文重口音语音数据库”荣获中国语音产业联盟“2015中国语音创新产品”称号
  • 粤语数据库的采集工作在粤语地区完成。录音地区覆盖范围为广东省110 个 行政区划,主要定位在珠海、佛山、三水、广州等粤语口音保持纯正地区。 该数据库总有效时长1000 小时,数据采样率为16K,采样精度是16bit,为 单通道录音,并以PCM 非压缩文件格式存储。 总共采集了1500 人的语音数据,所有发音人均是广东本地人,粤语发音纯 正,朗读自然流利。男女性别比接近1:1。 语音采集设备是智能手机,采用基于Android、IOS 两种系统的多种品牌型号 手机进行录制; 录音环境有室内、室外多种真实场景。 全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。 数据质量优于业内平均水平。
  • 慧听人物轮廓图像数据库共收集制作了20,000张轮廓图像。所有轮廓图像数据均为人物轮廓。人物轮廓分为人身轮廓和人脸轮廓。轮廓区域为黑色,其余背景区域为白色。全部轮廓均由图像制作软件photoshop制作而成。 20,000张图像分有两批,第一批为网络图像,涵盖街拍、写真、生活照,共12,000张;第二批为步态图像,来源均为人物行走步态,共8,000张。 网络图像来源多样,尺寸大小不等;步态图像由海康威视摄像头拍摄后截取而成,尺寸均为1920*1088像素(宽*高) 图像遍布男女老少各个年龄段,涵盖各种着装打扮,包含站立、行走、蹲坐等多种姿势。 2万张图片均由标注团队细心制作,保证整体轮廓线偏差控制在3像素内。 该数据库标注质量高,可用于图像处理、轮廓识别、步态跟踪处理等用途。
  • 慧听步态视频数据库一共采集了1000人的步态视频数据。所有拍摄人的步态均为日常生活中的正常行走姿态,步伐自然,步速均匀适中。采集场景有三种,均为室外采集。 拍摄人涵盖各年龄段,最小4岁,最大85岁。男女比例1:1,各500人;60岁以上老人占总人数20%,为200人。 步态拍摄设备为海康威视监控摄像头。数据库视频分辨率:1920*1080@25fps,格式为MP4。 拍摄角度:26=2(俯视+平视)*(4台摄像机与2个行走方向(0°/45°)组合得到13个视角,分别为0°15°30°45°60°75°90°105°120°135°150°165°180°)。 场景:3(静态简单,静态复杂,动态复杂)。 着装:3(正常,外套,背包)。 行走状态:静态简单,静态复杂场景为1个(行走) 动态复杂场景为2个(行走,暂停)。 分序列数:2个,全局ReID记录视频:3个 每人共行走步伐:48段 摄像头总数:24个 全部视频数据由标注团队成员细心切分,每个场景8路镜头视频同步率不低于95%。 该数据库能够反映正常人在行走过程中的基本行为特点,画质清晰,播放流畅,可用于监控系统、身份识别、人脸识别、行为分析等多种用途。
  • 慧听台湾国语语音数据库的采集工作在台湾完成。录制地区包括台北、台中、台南、台东、高雄、新北、新竹、彰化、淡水、桃园、嘉义、屏东等市区。 该数据库总有效时长75小时,数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。 已采集了100人的语音数据,所有发音人为当地台湾人,说台湾国语1:1。 【该数据库目前正在扩大录制规模,录音人数还在不断增长】 语音采集设备是智能手机,采用基于Android系统的多种品牌型号手机进行录制; 录音环境有以室内为主。 全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。 该数据库为典型的台湾国语语音,数据标注质量高,可用于语音识别系统训练、测试、语音分析、台湾国语研究等多种用途。
  • 慧听儿童中英文语音数据库总共采集了140名儿童的语音数据。录音儿童年龄为5岁~12岁,男女性别比接近1:1。儿童发音自然流利。 录音内容为中英文。中文部分句子长度3~30字,内容为儿歌、童话故事、小学语文1~6年级课文等;英文部分覆盖所有小学英语课本涉及的单词,分为两种读法:按单词发音、按单词的字母拼读。 该数据库总有效时长50小时。其中,中文部分时长25小时、英文部分时长25小时(包含单词发音、字母拼读两种读法)。数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。 语音采集设备是高端智能手机。 所有录音数据均在安静、无回声的室内完成。 全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于2%。 该数据库能够反映中国儿童不同年龄段普通话发音与英语发音的特点,数据标注质量高,可用于儿童语音识别系统训练、测试、儿童发音分析、儿童语言教学研究等多种用途。
经典推荐
  • {{item.name}}