ICTCLAS在的国家973评测中的评测结果

语料领域 分词总数 分词正确率(%) 上位词性标注正确率(%) 上位词性标注相对正确率(%)
体育 33,348 97.01 86.77 89.31
国际 59,683 97.51 88.55 90.78
文艺 20,524 96.40 87.47 90.59
法制 14,668 98.44 85.26 86.59
理论 55,225 98.12 87.29 88.91
经济 24,765 97.80 86.25 88.16
总计 208,213 97.58 87.32 89.42

说明:

1.以上数据来源:国家973英汉机器翻译第二阶段评测的评测总结报告;

2.报告发布者:国家重点基础研究项目(973项目)“图像、语音、自然语言理解与知识挖掘”项目汉英机器翻译评测系统组;发布时间:2002.9.2;

3.国家973英汉机器翻译第二阶段评测,评测时间:2002.7.6;评测地点:中科院自动化所模式识别国家重点实验室;评测主持:姚天顺老师。评测素材大小:约800K;

4.由于我们采取了北大的词性标注集,和973专家组的词性标注集有出入,所以词性标注的正确率不具可比性。                 

[跟我们联系|参与开放项目|返回主页]

Copyright©2002 软件室mtgroup版权所有