• 慧听中文词性数据库共包含100万条中文句子的词性标注语料。每条句子长度在10字左右,均为日常口语类、短信类。 该数据库词性的标注,是由专业的团队标注完成的。该团队成员均为中文、对外汉语专业本科及以上学历水平的人员组成,且经过专门的训练。标注词错误率低于5%。 该中文词性数据库可用于语言理解研究、语法研究和语言模型构建等多种用途。
  • 慧听中韩平行语料库总共包含100万对中韩平行语料。其内容包括:新闻、电影、音乐、短文、口语句子等。 该平行语料库数量较大。所有平行语料,在经自动处理后,再由韩语专业的人员进行了筛查、整理、检查,以确保翻译的准确性和内容的正确性。 中韩平行语料库可用于机器翻译的用途。