赞
踩
句法分析是机器翻译的核心数据结构,是对语言进行深层次理解的基石。
与别的语言处理所需要的数据集不同,句法分析需要的是一种树形的标注结构,又称为树库,如下图所示:
最常使用的树库为美国宾夕法尼亚大学的英文宾州树库PTB,中文树库则包括CTB、TCT和台湾中研院树库。
主要任务是评测句法分析生成的树结构与手工标记的树结构之间的相似性程度。
主流的评测方法是PARSEVAL评测体系,主要考察准确率、召回率、交叉括号数。其中交叉括号表示分析得到的某一个短语的覆盖范围与标准句法分析结果的某个短语的覆盖范围存在交叉又不包含的关系,即构成一个交叉括号。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。