0.1 本文的研究内容和贡献

      由黄曾阳先生创立的HNCHierarchical Network of Concepts)理论建立了表述和处理自然语言的新模式(黄曾阳1997,1998),其模式之一是关于自然语言语句的语义表述模式,该模式以句类和语义块的概念为基础,构造出了语句的表示式,并发现了自然语言语句的57个基本表示式,称为基本句类。句类是语句的语义结构类型,语义块是语句的语义构成单位,基本句类是语句语义类型的基元,它们可以通过组合形成混合句类和复合句类。基本句类、混合句类和复合句类形成HNC的句类体系。不同的句类具有各自的不同特征,称为句类知识。

      本文的研究内容就是句类知识,具体工作有三个方面,这也是本文的主要贡献:

      1)系统地阐述了句类知识的基本内容、表示方法和相关的理论问题。

      2)详细地阐释了57个基本句类及常见混合句类的句类知识。

      3)结合自然语言理解处理的具体问题,通过实例论述了句类知识的应用。

      HNC的语言理解处理模式称为句类分析,句类分析所依靠的关键知识就是句类知识。本文研究的句类知识已经应用于句类分析系统,其应用价值已经得到检验。事实上,句类知识是自然语言理解处理所需要的最基本、最重要的知识,可应用于自然语言理解处理的各个领域。

      句类知识是客观存在的语言知识,是描述和分析自然语言所必需的知识,本文的题目冠以“HNC”,是表明句类和句类知识的概念是HNC发现和提出的,句类知识的研究是在HNC的理论框架下进行的,而并不意味着还存在别的理论或方法下的句类知识。

0.2 本文的结构

      除引言和结束语外,本文共11章。

      第一章,HNC与句类。简要讲述HNC的基本内容和她建立的语句表述模式,介绍语义块、句类和句类表示式的概念。

      第二章,句类知识总论。系统阐述句类知识的基本内容和表示方法,以及一些相关的理论问题和句类知识的通则。

      第三~九章,详细阐释基本句类的句类知识。57个基本句类的上一级分类是7大句类:作用句、效应句、过程句、转移句、关系句、状态句和判断句,每一类的句类知识形成一章。

      第十章,混合句类的句类知识,重点阐述了一些常见混合句类的句类知识。

      第十一章,句类知识的应用,结合多动词处理和专名识别问题阐述句类知识的应用。

      以上11章可分为四部分:第一章是第一部分,讲述理论背景;第二章是第二部分,从总体上阐述句类知识;第三章到第十章是第三部分,分别阐释各句类的句类知识;第十一章是第四部分,论述句类知识在自然语言理解处理中的应用。后三部分是本文的重点,第三部分是重中之重。

0.3 相关研究概述

 

首先指出,HNC的句类不同于语言学研究中的句类,前者是句子的语义类型,而后者是从语用角度划分出的句子类型,如陈述句、疑问句、祈使句、感叹句等等。

句类和句类知识是HNC提出的概念,她所建立和发现的语句表述模式及句类表示式都是前所未有的,因此,关于句类知识的已有研究成果主要是黄曾阳先生进行的阐述。黄先生在《HNC(概念层次网络)理论》一书中指出了句类知识的基本内容,并说明了它们在句类分析(即对语句的理解处理)过程中所起的关键作用。书中第二部分的论文14151721简要阐明了作用句、效应句、转移句和混合句的句类知识,重点在于说明句类表示式的构造和概念节点的内涵。此外,黄先生还撰写了《基本句类知识要点说明》的部分手稿。这些论述是本文研究句类知识的基础和起点。

山克的概念从属理论(Conceptual Dependency Theory)对HNC理论的形成产生过重要影响,山克对转移这一概念进行了比较深入和系统的研究(Schank 1975a),HNC对转移的概念节点设计就吸收了他的成果,我们研究转移句的句类知识,自然也受益于此。

菲尔墨(Fillmore)的格语法(Case Grammar)是对HNC产生过影响的另一理论,格和格框架(或称句模)与语义块和句类表示式有相似之处,但它们是不同的概念,具有重大差别,本文的1.2.4.3节对此进行了讨论。

对句类知识的研究是为自然语言理解处理建立知识表示体系和提供知识,在这个方面,已有很多著名的理论方法和研究成果,如复杂特征集的表示方法,美国的CYC计划和WordNet,日本的EDR,董振东先生的知网(hownet)等,句类知识的表示方法和内容与它们是不同的,最重要的区别有两点:第一,句类知识有句类表示式作为纲领;第二,句类知识的表示是用HNC建立的表达概念联想关系的符号体系,而不是用自然语言来描述自然语言。对此,黄曾阳先生在专著的《关于汉语HNC知识库的建设》一文中进行了精要的阐述。

语言学中有很多研究成果实际上涉及到了句类知识的某些方面,例如:对存现句的研究涉及到了HNC的存在判断句和换位状态句;对兼语句的研究涉及到了作用效应句;对“把”字句和“被”字句的研究实际上涉及到语句格式知识;逻辑语义学的研究涉及到语言逻辑概念和语义块之间的逻辑关系;……由于所用的理论方法和视角不同,本文对句类知识的研究较少直接利用这些研究成果,但我们认识到,语言学的许多研究成果都可以吸收到句类知识的体系当中来,它们可以成为获取句类知识的宝贵源泉,这是一个十分重要的课题,我们将努力探求。