“有”字一论

—— “有”字的概念阐释

黄曾阳  李颖

(中国科学院声学所,北京 100080)

 

“有”字非同寻常,我们将陆续写3篇小文进行论述。一论“有”字的概念阐释,二论”有”字的语言信息处理(交互引擎处理),三论”有”字的汉英翻译处理(翻译引擎处理)。此文为一论。这里使用了“概念阐释”,而未使用“语义阐释”,因为概念阐释不仅是语义阐释,还包括语用和语法阐释。词典对词语的阐释实际上也是这么做的,释义是语义解释,举例则涉及语用和语法了。不过词典所采用的方式是以语言解释语言,这种方式适用于交际引擎,但不适用于交互引擎。为适应交互引擎运作的需要 对词语的概念阐释需要采取语言阐释和HNC符号阐释并举的方式。HNC符号阐释的要点是:用概念基元符号[1][2]说明词语的语义,用句类代码[3]说明词语的语用,用概念类别和格式代码[4]说明词语的语法。

“有”字的概念阐释要从存在之有、具有和拥有(领有)说起,这三有是”有”字的基本意义,其他都是派生义。如下表所示

“有”字概念阐释表

  

语言解释 概念类别 映射符号 句类代码 现汉对应
存在之有 v jl11e21 jD1J//jD10J 义项2
具有 v 50e21 S0J *义项5
拥有 v 461 R611J 义项1
TT转换 Et (jD1,E)J *义项3
出现 v 311 Y10J 义项4
不定特指 u l94 义项6、7
礼貌语言 qv |q715e65 义项8
古汉语语习 q  f6y+|pj1*  义项9

               

 

下面将围绕这张表进行论述,分3节:1、关于前3项概念阐释的说明;2、关于TT转换说明;3、关于本文阐释方式与《现汉》方式的比较

 

1关于”有”字前3项概念阐释的说明

“有”字前3项概念阐释的语言解释和相应的概念基元符号是:“存在之有”jl11e21、“具有”50e21和“拥有”461,这3“有”(概念基元)是“有”字的基本意义,三者都是对偶概念,前两者为非黑氏对偶e2m,后者为黑氏对偶m[5],三者的映射符号表达了这一信息。三者之间具有强交式关联,而存在之有为本,这些信息在相应概念基元的后台表示。

“存在之有”jl11e21属于基本逻辑概念林jl的基本判断概念树jl1的根概念(有无判断)jl11的延伸概念jl11e2m,其对偶概念为“无”jl11e22。概念基元jl11e2m大体与《老子》所阐释的有无对应。

“具有”属于作用效应链概念林φ的状态概念树φ5的根概念(状态基本特性)φ50的延伸概念50e2m,其对偶概念为“没有”50e22。

“拥有”461属于作用效应链概念林φ的关系概念树φ4的根概念(拥有和失去)φ46的延伸概念46m,其对偶概念为“失去”462。

按约定 作用效应链概念林的符号φ一律省略不写。

延伸概念jl11e2m对应的句类代码是jD1J//jD10J,句类名称是存在判断句;延伸概念50e2m对应的句类代码是S0J,句类名称是一般状态句;延伸概念46m对应的句类代码是R611J,句类名称是单向关系句。三者分属于57组基本句类的53号、47号和28号。对应的句类表示式如下:

jD1J=DB+jD1+DC

         S0J=SB+S0+SC

R611J=RB1+R611+RB2

存在判断属于基础判断之一,基础判断联系于基本逻辑概念林jl,是一切判断的基础,基础判断包括比较判断和基本判断,比较判断联系于概念树jl0,基本判断联系于概念树jl1,比较判断和基本判断又包括各自的子判断,与概念树jl0和jl1的根概念相对应。这里只说基本判断的子判断,它包括状态判断jl11、势态判断jl12和情态判断jl13,三者构成基本判断概念树的3个根概念。一切生命体都具有比较判断和状态判断的能力,否则就不能生存。状态判断又区分是否判断和存在判断,分别联系于状态判断jl11的延伸概念jl11m和jl11e2m。是否判断要求判定某特定对象DB是//不是某种东西DC;存在判断要求判定某特定广义空间DB存在//不存在某种东西DC。以上所述 是存在判断联想脉络的概要,而最后一句则是存在判断句jD1J的基本句类知识。

状态描述属于作用效应链描述的第六(最后)环节,一般状态描述联系于状态基本特性50的描述,统称一般状态句S0J,当S0J联系于延伸概念50e2m时 它集中描述某特定状态对象SB具有//没有某种特定属性SC,这是一般状态句S0J的基本句类知识之一。

关系描述属于作用效应链描述的第五环节,区分单向关系和双向关系两种基本类型,单向关系描述通常又要区分主从性和对等性,句类Rm11J描述具有主从性的单向关系,语义块RB1代表关系的主导方,语义块RB2代表关系的从属方。这是单向关系句的基本句类知识,联系于延伸概念46m的句类R611J是单向关系句Rm11J的具体类型之一,它继承上述基本句类知识,同时它还具体规定主从双方表现为拥有和被拥有的关系。

上面概要说明了存在之有、具有和拥有的概念阐释,三者的映射符号对应着语义解释,句类代码符号对应着语用解释,概念类别符号对应着词法解释,而表中未列出的格式代码符号则对应着句法解释。论述围绕着各句类代码所对应的语义块而展开,这意味着 语义-语用-语法解释是以“语义块是句类的函数”这一基本论据(定律)为基础的。

 然而 上面的论述还只涉及到概念阐释的纵向方面,而没有涉及概念阐释的横向方面,那就是三者的相互联系与比较。上文说到 存在之有、具有和拥有这“三者之间具有强交式关联,而存在之有为本”,这只是三者相互联系的要点,下面作具体分析。

汉语将存在之有、具有和拥有这3个概念都使用同一“有”字来参与描述,而且对存在之有单用“有”,这是汉语的精彩之处,充分体现了上述三者相互联系的要点。但另一方面,汉语又可以单用“有”替代三者,这又是汉语不确定性的过度表现了。交际引擎对语言的这类不确定性(模糊)表现可以应付裕如,但交互引擎就可能陷入绝望的困境,HNC把这一困境叫做多句类代码难点,并列为语句理解处理的20项难点之首[1]——1号难点。

交互引擎如何摆脱这一困境呢?多句类代码难点的提法意味着这一难点只能依靠不同句类的不同句类知识去解决多句类代码的多选一难题,形象地说 就是解铃还得系铃人。上面概述了存在句的DB与DC、一般状态句的SB与SC、单向关系句的RB1与RB2这3对广义对象语义块的各自语义指向。这些语义指向不仅范定了相应语义块的概念优先特性,同时也范定了每一对广义对象语义块内部两者之间的相互依赖性。存在句jD1J的DB与DC之间的相互依赖性最弱,一般状态句的SB与SC之间的相互依赖性最强,单向关系句S0J的RB1与RB2之间的相互依赖性低于一般状态句,但远高于存在句。一般状态句的SC是SB的内在物或固有特性,因而两者必然共存亡,当SB不存在时 SC亦不复存在。反之 当SC不存在时 SB就不再是原来的SB了。单向关系句Rm11J的RB2不是RB1的内在物,而是RB1的外在物,两者不具有共存亡特性,当RB1不存在时 RB2可照样存在,反之亦然。至于存在句jD1J的DB与DC 之间 上述共存亡特性的描述对它们是完全没有意义的。这些就是三“有”概念阐释横向方面的基本内容。

本节最后应该指出 交际引擎之所以对1号难点应付裕如就是因为它具备上述纵向和横向知识,HNC把这些知识叫做句类知识。交互引擎要摆脱1号难点的困境,就必须也逐步掌握这些句类知识。这个问题在本文的续篇“二论”中还会有进一步的讨论。

 

2关于TT转换说明

这里说基本转换是基本的句类转换的简称。句类转换是一个十分重要的概念,这里稍作说明。一个语句所表达的意思可以不同类型的语句来表达,也可以用同类语句的不同格式来表达,在HNC术语里 前者叫做句类转换,后者叫做格式转换。例如 “这个老头没有子女,老伴也去世了”“这是一个孤老头子”说的同一件事,但使用了不同的句类,这属于句类转换。“张三批评了李四一顿”“张三把李四批评了一顿”说的也是同一件事,但使用了不同的语句格式,这属于格式转换。

句类转换和格式转换各有自己的最高理性法官,本文第一作者5年前在HNC沙龙上曾以“语言概念空间的最高理性法官”为题作过一次学术报告,其中谈到句类转换的3位最高理性法官,他们是YN(yes or no)转换、TT (there is or there is not)转换和DA(the description of attributes)转换,符号表达分别是(jD,E)J、(jD1,E)J和(S04,E)J。YN转换的意思是任何句类都可以转换成是否判断句,TT转换的意思是任何句类都可以转换存在判断句,DA转换的意思是任何句类都可以转换成简明状态句。由于这3项句类转换对转换前的语句没有概念类型的先决条件要求,故列入最高理性法官。

“有”和“没有”是汉语实行TT转换的工具,例如“章伯钧有位女公子最近出了一本畅销书《往事并不如烟》”、“在20世纪30年代的德国 没有任何人敢说希特勒的坏话”这两个语句里的“有”和“没有”就是实行TT转换的工具词,这两个例句的前者实际上是“章伯钧的女公子章诒最近出了一本畅销书《往事并不如烟》”的TT转换,例句的后者实际上是 “20世纪30年代的德国人都不敢说希特勒的坏话”的TT转换。

“有”的TT转换功能在汉语文本里俯拾即是。因此 把这一义项紧列在“有”的3个基本义项之后乃势在必行之举。

 

3本文阐释方式与《现汉》方式的比较

《现汉》是学界对《现代汉语词典》的简称,《现汉》的权威性无可争议。但读者从“有字概念阐释表”可以看到,本文的阐释方式与《现汉》方式有很大差异。

这一差异首先来于两种方式的着眼点和立足点都不同。《现汉》方式服务于人类交际引擎的运作,而本文方式服务于人与计算机交互世界的交互引擎之运作,这是着眼点的不同,上文也提到了。然而 更重要的差异也许是立足点不同。

《现汉》的立足点实质上仍然是语言空间而不是语言概念空间。这一论点必然会引起极大争论,我们欢迎这一争论,因此在这里坦率地把这一论点说出来。

语言概念空间的基本结构在[1]有详细论述,在语言概念空间的视野里,对词语各义项之间相互关联性和主从性的阐释具有第一位重要性,“有字概念阐释表”(下文将简称阐释表)是依据这一基本原则编制的。“有”字的主要义项是存在之有、具有和拥有,而三者又以存在之有为本原。这是语言概念空间视野里的语言现象,是阐释表的第一要点,而《现汉》未作这一考察。这里的差异有形式与内容(实质)两方面。形式上似乎只是义项排序的不同,实质上本文的“具有”并不与《现汉》的义项5完全对应,故表中打了*号以示区别。《现汉》义项5的解释是“表示多,大”,例句有“∽学问,∽经验,∽了年纪”,例句与解释固然吻合。但是 “有点学问,略有经验”里的“有”就没有“多”和“大”意思了,那么 把义项5的“多与大”看作“具有”的语用延伸是否更恰当一些呢?

阐释表的第二要点是TT转换,这也是概念空间视野的语言现象,它构成阐释表的第四项阐释,与《现汉》的义项3并不对应,所以也打了*号。义项3的解释是“表示估量或比较”,例句有“水∽一丈多深,他∽哥哥那么高了”,估量属于状态的数量描述,可采用(汉语常用)简明状态句(句类表示式为S04J=SB+SC),比较属于基础判断的比较描述,可采用多种基本判断句,这里是参照比较判断句,其句类表示式为jD021J=DB1+ljlv+DB2+jDC。《现汉》的两例句分别属于(jD1,S04)J和(jD1,jD021)J句类转换。估量和比较不是“有”的固有义项,只是其本原义jl11e21之转换功能的表现,这样的转换现象太多了,如果见到一种TT转换就赋予“有”以相应语义,那是不可思议的,第二节的例句就是明显的示例。这是HNC的阐释。请读者批评指正,上列句类表示式见引文[4]。

阐释表的第三要点是不定特指l94,它是语言逻辑概念林l的概念树l9里的根概念之一。HNC的语言逻辑概念林与传统语言学的介词、连词、部分代词、部分副词存在复杂的联系,将在《HNC概念基元符合体系手册》的第五章作系统论述,但此书的编撰和出版还需要很长时间,此前将写系列小文在本网络季刊发表,以便听取同行对该《手册》编撰的有益建议。《现汉》的义项6和7都对应l94,显然 《现汉》的分类更为精细,HNC映射符号具备这一潜能么?上述计划中系列小文会涉及这个问题。

阐释表的其他各项是《现汉》解释的直接符号变换,这就不作说明了。

 

4结束语

    已故的林杏光先生生前曾多次建议HNC要多写一些与传统语言学接轨的文章。鲁川先生也多次同本文第一作者讨论过这一重大课题。对本文作者而言 这是第一次尝试,力有不逮,尽力而已,恳请批评指正。

这篇小文未涉及学界关于“有”字或有“字”句的论文,这将在二论和三论里“补过”。


参考文献

[1] 黄曾阳  在反思中前进,在碰撞中成长[A]. 语言概念空间的基本定理和数学物理表示式[C]. 海洋出版社,2004.7

[2] 黄曾阳  语义及概念体系在NLP的应用[A].《中文信息处理若干重要问题》[C],2003,科学出版社。

[3] 黄曾阳  HNC的发展与展望[J]. 汉语学报,2001上卷

[4] 苗传江  《HNC导论》[M].清华大学出版社.2004. (待出版)

[5] 李颖 池毓焕 对偶性概念的HNC阐释[J].《中文信息学报》,2004年第3期


作者简介:

黄曾阳(1935~  ),男,湖北蕲春人,1958年毕业于北京大学物理系。1988年以前,主要从事声纳系统研究。1989年以后,转向自然语言处理领域,创立了概念层次网络(HNC)理论。