1

HNC的发展和未来(讲话稿)

 

黄曾阳

 

   本文首先阐释了概念空间、语言概念空间和自然语言空间的含义,

   从而说明HNC理论的基本定位:

     仅研究从自然语言空间到语言概念空间的映射,

     即研究自然语言的理解过程。

 

   这一映射涉及两个基本理论问题:

      一是建立语言概念空间的概念基元符号体系,

      二是建立语言概念空间的语句基元符号体系。

 

   文中对这两个符号体系作了系统的阐释,

     并在这个基础上提出了句类表示式、

        语句表示式及语句格式的概念。

 

   最后,结合许嘉璐先生最近提出的

     关于中文信息处理第二战役的设想,

   概述了作者关于自然语言理解处理的一些基本看法。

 


 

2

1引言:提倡学术碰撞,

 

2HNC只研究自然语言的理解过程

   HNC理论是一个关于语言概念空间的理论,

   但它只研究这个空间的部分特性,

   即与自然语言的理解过程有关的特性,

   这是HNC对自身研究范围的基本定位。

 

3、语言概念空间的概念基元符号体系

3.1抽象语言概念空间的4项假设和4类子空间

3.2抽象语言概念空间的数字符号设计

3.3语言概念空间的子空间设计

 

4、语言概念空间的语句基元符号体系

   4.1语句块表示的符号体系和符号化

   4.2句类表示式及句类知识

   4.3 语句表示式及其格式

5、结束语


3

学术交流的根本意义在于引发学术碰撞,

学术碰撞是科学进步的根本动力。

没有碰撞的学术必然衰落,

碰撞活跃的学术必然兴旺。

这是东西方科学技术发展形成巨大反差的根本原因。

 

          碰撞 ¹(争鸣;交流;融合)

 

这次研讨会语言学各流派聚首一堂,

是开展学术碰撞的大好时机,

更是HNC向各流派学习的大好时机。

学习就要真诚地欢迎碰撞,

但是,HNC是从语言学之外闯进来的一位“不速之客”,

这位“不速之客”不仅面孔生疏,而且穿戴有点“奇装异服”的味道,

这“奇装异服”会给学术碰撞带来极为不利的影响。

所以,我提交的论文,虽然奉命采用“HNC的发展与未来”的名称,

实际上给“偷梁换柱”了,

主要是阐释HNC的基本思路,试图做一次“化奇异为平常”的努力,

为开展碰撞扫清一些障碍。

这努力可能取得一点成功,但也可能失败。

为了减小失败的风险,

我的报告,将再次“偷梁换柱”,

仅仅围绕着“化奇异为平常”这个中心来谈。

其它的内容,就麻烦大家看文字了。


 

4

HNC的奇异点在哪里?

仿效维特根斯坦的说法,

  在于把语言“游戏”转变成语言数字“游戏”。

 

目前只有两组“游戏”:

第一组是把自然语言语词符号体系转变成一组数字符号体系

  也可以说是语义层面的“游戏”

第二组是把自然语言语句符号体系转变成一组大写英文字母符号体系

  也可以说是句法-语用层面的“游戏”

 

为什么作这个转变?

  “以人为本”==》“以机为本”

  自然语言空间==》语言概念空间

 

准确地说

      1、小写英文字母串+数字串  çè  概念基元符号体系

      2大写英文字母串+数字串  çè  57组基本句类表示式+

                                   3192组混合句类表示式。


5

对第一项“游戏”,确定三条规则:

  1   要求每一位数字或每一个字母

都具有唯一确定的意义,

  2   要求每一数字串从起点开始在任何一点截断,

具有相应的整体意义

3   要求数字串的排序

      表现概念局部联想脉络的三项基本内容:

        层次性、内部关联性、外部关联性

 

    看三个例子:

        0          作用

        00         “免除”和“约束”之外的所有作用(基本作用)

        01         对作用的承受

        02         生命体对作用的反应

        03         对作用的免除

        04         约束,使对象“有所不为”的作用

 

        23[9]        定向信息

        23[9](1)    

        23[9](1)[9]   质问

        23[9](2)    

        23[9](2)[9]   抵赖

        23[9](ea4)   依托于一定关系的定向信息(建议)

        23[9](ea5)   自上而下(指示,命令,批准)

        23[9](ea6)   自下而上(汇报,请示,呈报)

        23[9](ea7)   无上下级关系、强期待应答(要求)

        23[98]      陈述

        23[99]      善意有益的定向信息(规劝,批评,警告)

        23[9a]      恶意有害的定向信息(指责,诽谤,恐吓,欺骗)

            23[9b]      对恶意有害定向信息的回应(辩解,驳斥)

 


(6)

    7          心理活动及精神状态

    71         心理活动

711                                                态度

712                                                理性为主导的态度

713                                                感性为主导的态度

714                                                反映自身素质的态度

715                                                对事业的态度

716                                                涉及利害关系的态度

717                                                人际交往中的态度

718                                                对一般事物及公益活动的态度

719                                                对亲近关系者的态度

 


(7)

       往上看:

710                                                心里反应

711                                                态度

712                                                愿望

713                                                情感

714                                                情绪(情感¥精神状态)

       往下看:

7115(n),(n=0-2)             (热情,冷淡)

7115(e7n), (n=1-3)          (礼貌,怠慢,恶劣)

7115[9]                     交往中的定位

7115[9](e4n),(n=1-3)          (不卑不亢,卑,亢)

7115[a]                     交往中的义利表现

7115[a](n),(n=0-2)             (慷慨,吝啬)

7115[a](n),(n=4-6)             (人情暖冷)

7115[b]                     交往中对善恶的反应

(7115[b]e1n, l14, r400eb5/r3219)        (报答,忘恩负义)

(7115[b]e1n, l14, r400eb5/r3229)       (大慈大悲,报复) 

 


(8)

            语言概念空间概念基元一般表示式

 

               y|(k|t|)|              (HNC1)

 

      y 高层:体现(显)概念的层次性    

                 y=0-d

      k中层:体现(显)概念的内部关联性 

              k=cmn;   k=dmn         对偶性

                 n=1-m

              k=emn; n  n=(0-3;4-6)     对比性

              k=-; -0; -00;              包含性

      t  底层:体现(隐)概念之间的关联性(即外部关联性) 

              t=8-b

 

 


9

                    语言概念空间全貌

 

     抽象概念空间                                具体概念空间

 

                                 p    w   

                                      

                                      

                                      

                                                 

                  

     f    f     j   l   jl     s  f,h,q   x    p,pe, w,pw, jw

     2   3-4    2   2    2     3        挂靠   挂靠  挂靠   2

     6    8     9   12   2     4                            7

 


(10)

         概念基元表示式=[类型符号][类别符号][数字串]  

        

        类型符号  概念类型 {f,j,l,jl,s,f}  {jw,w,p,pe,pw,gw,rw,rvw¼}

                  以主体基元概念为核心

        类别符号  五元组特性 {v,g,u,z,r}

        每一类型根节点的个数:确定

        高层位数:确定

 

        语义场的具体化

        义素的具体化

  “语义场分析和义素分析提出了一些而不是全部语义分析维,

  只能用于有限的语义空间,

  用于全部词语还远远不能胜任。”

        这个说法恐怕需要修改了。

 


(11)

对第二项“游戏”,确定六条规则:

  1  语句按主体基元概念分类

   J=J(x)   xÎ{X,P,T,Y,R,S,D}=>Ei

  2  语句由若干个语义块K构成

   J(x)=SK(x)

3  区分三种类型的语义块JKEKfK

         J(x)=SJK(x)+ SEK(x)+SfK(x)

4  区分JK的三种要素ABC

                {A,B,C}=>G

          A=Actor     表述作用方    命名为作用者

          B=oBject    表述效应方     命名为对象

          C=Content   与每一方相联系的表现,命名为内容。

  5   若将EK简记为   EK(x)=Ei

 JK可简记为    JK(x)=EiG|

  6   假定fK(x)弱依赖于x,即

                fK(x)@fK

 

于是,语句的语义块表示可写成

             J(x)= S(EiG|)+ SEi+ SfK

考虑简单句,上式可简化成

             J(x)= S(EiG|)+E+ SfK              HNC1

 


(12)

                一段“套话”

  作用效应链反映一切事物的最大共性,

  作用存在于一切事物的内部和相互之间,

  作用必然产生某种效应。

  在达到最终效应之前,必然伴随着某种过程或转移, 

  在达到最终效应之后,必然出现新的关系或状态。

  过程、转移、关系和状态也是效应的一种表现形式。

  新的效应又会引发新的作用,

  如此循环往复,以至无穷,

  这就是宇宙间一切事物存在和发展的基本法则,

  也是表达和概念推理的基本法则。

 

              “套话”的中心意思是:

  作用效应链的6个环节是任何事物的6个基本侧面。

  如果一个事物的这6个侧面都得到了充分描写,

  那么这一事物的面貌和特征就足够清晰了。

  所谓一个事物的知识表示,

归根结底就是对这6个侧面的表述,

  所谓对一个事物的理解,

就是要把握这6个侧面的信息和知识。

  语句既然是对事物的表达,

那作用效应链当然也就是语句表达的核心内容。

  因此,作用效应链既是核心概念基元分类的总纲,

        又是语句分类的总纲。

 


(13)

  把语句的语义块表示改造成语句表示式

               J=JK1+EK+JK2+JK3+¼ (x)

          J3=JK1+EK+JK2        (x)