863项目“语境根概念研究”正式启动 

 

  由声学所语言语音及交互信息技术部语言知识处理实验室黄曾阳研究员任课题负责人的国家高技术研究发展计划(863)课题“专业和追求活动语境概念林的根概念研究”已于近日启动。

    该课题的目标是在2008年前,通过对HNC理论中语境根概念的研究,为交互引擎语境单元萃取和语境生成技术的设计与运作提供信息资源。该课题的启动标志着中文信息处理三大流派之一的HNC理论对自然语言的理解处理理论研究从单句全面转入句群处理的新阶段的开始,也标志着在该领域研究中,以模拟人脑语言智能为方式的HNC理论已率先向更加困难的句群篇章处理发起了全面的攻势,这将保持我所在自然语言理解理论研究方面的领先优势,为形成具有基本人类语言智能的信息处理技术奠定坚实的基础。

  近年来,随着知识经济时代的到来,作为知识经济载体的语言研究越来越受到世界各国的普遍重视。HNC理论通过多年的研究,提出了自然语言语言空间应分为短语、语义块、句子、句群和段落六个层次的论断,通过对不同层次的研究最终实现计算机对自然语言的理解。它与目前普遍采用的基于语法规则和基于统计概率的信息处理思想相比是一种全新的思路,将实现计算机对信息处理由表层处理向深层处理的转化。HNC理论通过对句子的组成单位(语义块)的分析并利用相应的句类知识,最终实现对自然语言语句的理解。HNC理论认为句类世界的根主要在主体基元概念(作用效应链),语境世界的根主要在扩展基元概念。该课题的研究内容,主要是对HNC概念符号体系的中底层进行设计,使其为语境单元萃取乃至语境生成提供所需要的激活信息和概念联想知识。具体的研究内容为:设计语境概念树延伸结构;描述每一延伸概念树的世界知识;列举每一延伸结构对应的汉语词语;列举每一延伸结构的句类;指定每一延伸结构的领域句类。

  本课题基于目前HNC理论已设计完成的概念延伸结构一般表示式、语境单元表示式、语境框架表示式,计划建设根概念映射库和HNC重组语料库。本课题的研究内容是HNC三项理论工程、四项技术工程和HNC研发平台的基础;本课题的研究是计算机理解自然语言的关键性的一步,将对整个中文信息处理技术的发展产生积极而深远的影响,为人机交互引擎的最终实现提供坚实的理论基础。