ICTCLAS在的国家973评测中的评测结果
语料领域 | 分词总数 | 分词正确率(%) | 上位词性标注正确率(%) | 上位词性标注相对正确率(%) |
体育 | 33,348 | 97.01 | 86.77 | 89.31 |
国际 | 59,683 | 97.51 | 88.55 | 90.78 |
文艺 | 20,524 | 96.40 | 87.47 | 90.59 |
法制 | 14,668 | 98.44 | 85.26 | 86.59 |
理论 | 55,225 | 98.12 | 87.29 | 88.91 |
经济 | 24,765 | 97.80 | 86.25 | 88.16 |
总计 | 208,213 | 97.58 | 87.32 | 89.42 |
说明:
1.以上数据来源:国家973英汉机器翻译第二阶段评测的评测总结报告;
2.报告发布者:国家重点基础研究项目(973项目)“图像、语音、自然语言理解与知识挖掘”项目汉英机器翻译评测系统组;发布时间:2002.9.2;
3.国家973英汉机器翻译第二阶段评测,评测时间:2002.7.6;评测地点:中科院自动化所模式识别国家重点实验室;评测主持:姚天顺老师。评测素材大小:约800K;
4.由于我们采取了北大的词性标注集,和973专家组的词性标注集有出入,所以词性标注的正确率不具可比性。