“基于语义的语句类型及其语料库标注规范研究”

结项鉴定会召开 



  2005年1月17日上午在声学所德昭楼218会议室召开了国家语委“十五”语言文字应用研究项目――“基于语义的语句类型及其语料库标注规范研究”成果鉴定会。该项目由国家语委于2002年12月批准立项,由声学所语言知识处理实验室承担完成。参加这次会议的有来自教育部语信司、语委语用所、中文信息学会以及北京大学、北京语言大学、北京信息工程学院的各位专家。语言知识处理实验室的部分研究人员和在读研究生也参加了会议。与会的鉴定委员会各位专家一致通过“基于语义的语句类型及其语料库标注规范研究”的技术鉴定,项目验收结果优秀。

  该项目以黄曾阳研究员创立的概念层次网络(简称HNC)理论为基础,从语言深层对自然语言语句的语义类型进行了分类研究,沿用句类和语义块的思路,探讨了语句深层结构的表述模式。经过艰苦的攻关,已经超额完成了计划任务书中预定的内容,最终形成了按照国家相关标准制定的、可供颁布实施的《语句深层结构语料库标注规范》(草案稿)。这一成果立足于语句、跨接词语(短语)和句群,清晰地表述了语句整体语义的深层结构,突出语句的内在概念联想脉络,切合语言表层和深层并举,提供了表层与深层分析的便捷表示方法,对于汉语形态表示弱、中心动词没有标记、词性模糊和多动词连见等语言特点有很强的表述能力。研究内容已经超越了传统语义的研究范围具有创新性和先进性,对语料库研究从语句表层迈向深层具有重要的意义。

  与会专家希望在本项目的基础上按照标注规范进行示范型语料库的研发工作,同时适时开展语境单元――句群层面语料标注规范的研究,使该项目研究的最终成果更好地服务于信息时代汉语基础资源的建设。(缪建明)