1

HNC的发展和未来(讲话稿)

 

黄曾阳

 

   本文首先阐释了概念空间、语言概念空间和自然语言空间的含义,

   从而说明HNC理论的基本定位:

     仅研究从自然语言空间到语言概念空间的映射,

     即研究自然语言的理解过程。

 

   这一映射涉及两个基本理论问题:

      一是建立语言概念空间的概念基元符号体系,

      二是建立语言概念空间的语句基元符号体系。

 

   文中对这两个符号体系作了系统的阐释,

     并在这个基础上提出了句类表示式、

        语句表示式及语句格式的概念。

 

   最后,结合许嘉璐先生最近提出的

     关于中文信息处理第二战役的设想,

   概述了作者关于自然语言理解处理的一些基本看法。

 


 

2

1引言:提倡学术碰撞,

 

2HNC只研究自然语言的理解过程

   HNC理论是一个关于语言概念空间的理论,

   但它只研究这个空间的部分特性,

   即与自然语言的理解过程有关的特性,

   这是HNC对自身研究范围的基本定位。

 

3、语言概念空间的概念基元符号体系

3.1抽象语言概念空间的4项假设和4类子空间

3.2抽象语言概念空间的数字符号设计

3.3语言概念空间的子空间设计

 

4、语言概念空间的语句基元符号体系

   4.1语句块表示的符号体系和符号化

   4.2句类表示式及句类知识

   4.3 语句表示式及其格式

5、结束语


3

学术交流的根本意义在于引发学术碰撞,

学术碰撞是科学进步的根本动力。

没有碰撞的学术必然衰落,

碰撞活跃的学术必然兴旺。

这是东西方科学技术发展形成巨大反差的根本原因。

 

          碰撞 ¹(争鸣;交流;融合)

 

这次研讨会语言学各流派聚首一堂,

是开展学术碰撞的大好时机,

更是HNC向各流派学习的大好时机。

学习就要真诚地欢迎碰撞,

但是,HNC是从语言学之外闯进来的一位“不速之客”,

这位“不速之客”不仅面孔生疏,而且穿戴有点“奇装异服”的味道,

这“奇装异服”会给学术碰撞带来极为不利的影响。

所以,我提交的论文,虽然奉命采用“HNC的发展与未来”的名称,

实际上给“偷梁换柱”了,

主要是阐释HNC的基本思路,试图做一次“化奇异为平常”的努力,

为开展碰撞扫清一些障碍。

这努力可能取得一点成功,但也可能失败。

为了减小失败的风险,

我的报告,将再次“偷梁换柱”,

仅仅围绕着“化奇异为平常”这个中心来谈。

其它的内容,就麻烦大家看文字了。


 

4

HNC的奇异点在哪里?

仿效维特根斯坦的说法,

  在于把语言“游戏”转变成语言数字“游戏”。

 

目前只有两组“游戏”:

第一组是把自然语言语词符号体系转变成一组数字符号体系

  也可以说是语义层面的“游戏”

第二组是把自然语言语句符号体系转变成一组大写英文字母符号体系

  也可以说是句法-语用层面的“游戏”

 

为什么作这个转变?

  “以人为本”==》“以机为本”

  自然语言空间==》语言概念空间

 

准确地说

      1、小写英文字母串+数字串  çè  概念基元符号体系

      2大写英文字母串+数字串  çè  57组基本句类表示式+

                                   3192组混合句类表示式。


5

对第一项“游戏”,确定三条规则:

  1   要求每一位数字或每一个字母

都具有唯一确定的意义,

  2   要求每一数字串从起点开始在任何一点截断,

具有相应的整体意义

3   要求数字串的排序

      表现概念局部联想脉络的三项基本内容:

        层次性、内部关联性、外部关联性

 

    看三个例子:

        0          作用

        00         “免除”和“约束”之外的所有作用(基本作用)

        01         对作用的承受

        02         生命体对作用的反应

        03         对作用的免除

        04         约束,使对象“有所不为”的作用

 

        23[9]        定向信息

        23[9](1)    

        23[9](1)[9]   质问

        23[9](2)    

        23[9](2)[9]   抵赖

        23[9](ea4)   依托于一定关系的定向信息(建议)

        23[9](ea5)   自上而下(指示,命令,批准)

        23[9](ea6)   自下而上(汇报,请示,呈报)

        23[9](ea7)   无上下级关系、强期待应答(要求)

        23[98]      陈述

        23[99]      善意有益的定向信息(规劝,批评,警告)

        23[9a]      恶意有害的定向信息(指责,诽谤,恐吓,欺骗)

            23[9b]      对恶意有害定向信息的回应(辩解,驳斥)

 


(6)

    7          心理活动及精神状态

    71         心理活动

711                                                态度

712                                                理性为主导的态度

713                                                感性为主导的态度

714                                                反映自身素质的态度

715                                                对事业的态度

716                                                涉及利害关系的态度

717                                                人际交往中的态度

718                                                对一般事物及公益活动的态度

719                                                对亲近关系者的态度

 


(7)

       往上看:

710                                                心里反应

711                                                态度

712                                                愿望

713                                                情感

714                                                情绪(情感¥精神状态)

       往下看:

7115(n),(n=0-2)             (热情,冷淡)

7115(e7n), (n=1-3)          (礼貌,怠慢,恶劣)

7115[9]                     交往中的定位

7115[9](e4n),(n=1-3)          (不卑不亢,卑,亢)

7115[a]                     交往中的义利表现

7115[a](n),(n=0-2)             (慷慨,吝啬)

7115[a](n),(n=4-6)             (人情暖冷)

7115[b]                     交往中对善恶的反应

(7115[b]e1n, l14, r400eb5/r3219)        (报答,忘恩负义)

(7115[b]e1n, l14, r400eb5/r3229)       (大慈大悲,报复) 

 


(8)

            语言概念空间概念基元一般表示式

 

               y|(k|t|)|              (HNC1)

 

      y 高层:体现(显)概念的层次性    

                 y=0-d

      k中层:体现(显)概念的内部关联性 

              k=cmn;   k=dmn         对偶性

                 n=1-m

              k=emn; n  n=(0-3;4-6)     对比性

              k=-; -0; -00;              包含性

      t  底层:体现(隐)概念之间的关联性(即外部关联性) 

              t=8-b

 

 


9

                    语言概念空间全貌

 

     抽象概念空间                                具体概念空间

 

                                 p    w   

                                      

                                      

                                      

                                                 

                  

     f    f     j   l   jl     s  f,h,q   x    p,pe, w,pw, jw

     2   3-4    2   2    2     3        挂靠   挂靠  挂靠   2

     6    8     9   12   2     4                            7

 


(10)

         概念基元表示式=[类型符号][类别符号][数字串]  

        

        类型符号  概念类型 {f,j,l,jl,s,f}  {jw,w,p,pe,pw,gw,rw,rvw¼}

                  以主体基元概念为核心

        类别符号  五元组特性 {v,g,u,z,r}

        每一类型根节点的个数:确定

        高层位数:确定

 

        语义场的具体化

        义素的具体化

  “语义场分析和义素分析提出了一些而不是全部语义分析维,

  只能用于有限的语义空间,

  用于全部词语还远远不能胜任。”

        这个说法恐怕需要修改了。

 


(11)

对第二项“游戏”,确定六条规则:

  1  语句按主体基元概念分类

   J=J(x)   xÎ{X,P,T,Y,R,S,D}=>Ei

  2  语句由若干个语义块K构成

   J(x)=SK(x)

3  区分三种类型的语义块JKEKfK

         J(x)=SJK(x)+ SEK(x)+SfK(x)

4  区分JK的三种要素ABC

                {A,B,C}=>G

          A=Actor     表述作用方    命名为作用者

          B=oBject    表述效应方     命名为对象

          C=Content   与每一方相联系的表现,命名为内容。

  5   若将EK简记为   EK(x)=Ei

 JK可简记为    JK(x)=EiG|

  6   假定fK(x)弱依赖于x,即

                fK(x)@fK

 

于是,语句的语义块表示可写成

             J(x)= S(EiG|)+ SEi+ SfK

考虑简单句,上式可简化成

             J(x)= S(EiG|)+E+ SfK              HNC1

 


(12)

                一段“套话”

  作用效应链反映一切事物的最大共性,

  作用存在于一切事物的内部和相互之间,

  作用必然产生某种效应。

  在达到最终效应之前,必然伴随着某种过程或转移, 

  在达到最终效应之后,必然出现新的关系或状态。

  过程、转移、关系和状态也是效应的一种表现形式。

  新的效应又会引发新的作用,

  如此循环往复,以至无穷,

  这就是宇宙间一切事物存在和发展的基本法则,

  也是表达和概念推理的基本法则。

 

              “套话”的中心意思是:

  作用效应链的6个环节是任何事物的6个基本侧面。

  如果一个事物的这6个侧面都得到了充分描写,

  那么这一事物的面貌和特征就足够清晰了。

  所谓一个事物的知识表示,

归根结底就是对这6个侧面的表述,

  所谓对一个事物的理解,

就是要把握这6个侧面的信息和知识。

  语句既然是对事物的表达,

那作用效应链当然也就是语句表达的核心内容。

  因此,作用效应链既是核心概念基元分类的总纲,

        又是语句分类的总纲。

 


(13)

  把语句的语义块表示改造成语句表示式

               J=JK1+EK+JK2+JK3+¼ (x)

          J3=JK1+EK+JK2        (x)                

          J4=JK1+EK+JK2+JK3    (x)                

         J21=JK+EK             (x)

         J22=JK1+JK2            (x)

 

      XJ     =  A+X+B                      基本作用句

      PJ     =  PB+P                       基本过程句 

      SJ     =  SB+S                       基本状态句

      T2J    =  TA+T2+TB+T2C              物转移句

      T3J    =  TA+T3+TB+T3C              信息转移句

      X20J   =  X2B+X20+XBC               一般反应句

      T492J  =  TA+T492+T4B2+T4C          先出交换句

      T4a10J  =  T4B1+T4a10+T4B2+T4C      扩展替代句

      XYJ    =  A+XY+B+YC,YC=(E)+EC       作用效应句

      S041J   =  SB+SC                     简明状态句

 

语义块是句类的函数—句类表示式—基本句类57—混合句类3192

 


(14)           

 

 

               J=JK1+E+JK2+JK3+¼

               J=JK1^+E^+JK2^+JK3^

               J=^JK1+^E+^JK2+^JK3

 

            语义块边界,SVO存在天然边界

            语句格式

            句类知识

 


(15)

关于“狐狸”和“刺猬”

      古希腊诗人阿奇洛丘斯说过:“狐狸知晓许多事物,而刺猬只懂一

  件重要的事”。杰出的思想史家贝林爵士用这句寓意深远的话表达了他

  对作家和思想家存有这一天壤之别的看法。一般说来,人们之间也可能

  存有这一深刻的差异。两者之间截然有别,一方面“刺猬”爱把一切与

  一种单一的中心观念相联系,根据这种单一的普遍的组织原则,他们的

  存在以及他们所说的一切便有了意义;另一方面,“狐狸”却追求多种

  目标,这些目标通常或毫无联系或相互矛盾,即使有联系,也仅仅是事

  件方面的关连。

          Rorty先生在《Philosophy and the Mirror of Nature》一书中

      区分了“大P”和“小P”哲学。“大P”哲学家是哲学界的“刺猬”,

      他们雄心勃勃地想使哲学成为其他一切学科的首要原则和基本原则,为

      科学家和人文主义者提供建构理论的主要原理。相反,“小P”哲学家

      是哲学界的“狐狸”,他们批判地检验自己那个时代的思想,提出他们

      所希望的富于启发性和指导性的述评,但不提供他们自己的观点,因为

      他们认为本来就不存在什么基本观点。因此,构思出理想国的柏拉图是

      一只理性主义的“刺猬”,是一个“大P”哲学家;而他的老师苏格拉

      底,那只叮在国家臀部上的牛虻则如一只“狐狸”,是一个“小P”哲

      学家。

                                    黎黑《心理学史》

                                         第二版序言

 


(16)

后期维特根斯坦——奥斯汀——瑟尔——哈贝马斯

语言游戏          言语行为理论      普遍语用学方案

  意义就是使用                     

  使用就是意义

为了否定意义的确定性,维氏经常提出一些诡诈的问题,下面是两个典型例子:

“在一座城市成为城市之前,它得拥有多少房屋和街道?”

试考虑…棋类游戏,纸牌游戏,球类游戏等等。对所有这一切,什么是共同的呢?”

  对第一个问题的回答:

城市之所以为城市,

不在于它拥有多少房屋和街道,

而在于它是这样一群人聚居的地方,

这些人的主体不直接从事农业生产。

HNC对城市的定义符号 pwj2就是以此为依据的。

  对第二个问题的回答:

维氏的意思是语言游戏不存在共同的普遍规则,只存在个别的具体游戏规则。

问题是,这个“个别”是开放的无限么?不存在有限的集团共性么?

HNC的回答是:

  不是开放的无限,存在有限的集团共性。

  所谓“语言游戏规则”,首要的是句类知识。

实际上“意义就是使用”的提法,

与其说是维氏的名言,不如说是维氏感受最深的困扰。

这一困扰主要来于:多义项、多句类代码、多格式、语义块分离和句类转换

  这五项复杂语言现象。

  但是,维氏确有其高明之处,他敏感地觉察到,

莫里斯和卡尔纳普所概括的语形(句法)、语义、语用的语言三维度之说,

缺乏一个主宰、一个灵魂,

他赋予“语用”以语言三维度灵魂的意义。

从而求得了心理困扰的摆脱。