English
8. 应用PolyU浅层树库
由于PolyU浅层树库同时提供了句法和语义信息,因此,可以被应用在很多NLP应用领域。首先,可以被用于训练和测试自动浅层句法分析器。其他的应用则包括搭配提取和时间表达获取等。
在2003年,CCLab开发了一个window-based给予统计的搭配提取系统,其精确度达到61%。由于提取出来的一下搭配实际上是一些高频率共现的词语组合,例如 医生-护士,因此被称为假搭配。由于这些假搭配具有相当高的共现统计优势,因此不能够通过单纯使用统计信息加以区分。由于语言学研究指出,搭配通常发生在一个短语内部,或者相关短语的核心词之间[Zhang and Lin 1992],因此,我们可以利用浅层分析树库中提供的句法信息,包括短语边界信息和中心词信息,对搭配候选的搜索进行细化和修正。从而,有效的提高搭配提取的精确度和召回率。
PolyU浅层分析树库也被用于时间表达式获取,由于树库中对时间短语TP标注了两类语义信息,时间点信息(TP-PO)和时间段信息(TP-DU)。这样的信息对于获取和分析时间表达是非常有益的。
|