第二章 句类知识总论

2.1 句类知识的基本内容及其表示

      句类知识的基本内容有四个方面:(1)语句格式知识;(2)语义块构成知识;(3)语义块之间的概念关联知识;(4)句类转换和语义块变换知识。

2.1.1 语句格式知识

        所谓语句格式就是一个句子中主语义块的排列顺序。(pp47)句类表示式表明了一个句类应该由几个主语义块构成,这些主语义块在具体的句子中可能以不同的顺序出现,这就是语句格式的不同,以基本作用句XJ为例,它有三个主语义块,即作用者A、作用X和对象B,“张三打了李四”是A+X+B格式,“张三把李四打了”是A+B+X格式,“李四被张三打了”是B+A+X格式。

        对一个句类来说,它所能够采用的语句格式的数量是确定的、有限的,这只取决于句类表示式中主语义块的数量,有两个主语义块的句类(简称两主块句)就只有2*1=2种可能的语句格式,三主块句就只有3*2*1=6种可能的语句格式,四主块句就只有4*3*2*1=24种可能的语句格式,这是个简单的排列问题。HNC把两主块句、三主块句、四主块句所能够采用的语句格式分别一一列举出来,并加以编码,这就是语句格式表示式格式代码。在语句格式表示式中,特征语义块用E表示,广义对象语义块(pp45)用JKm表示,m的取值与JK在句类表示式中出现的顺序一致,即JK1JK2JK3分别表示句类表示式中的第一、第二和第三个JK。在各种可能的语句格式中选定一种作为基本格式*,其他的称为非基本格式。理论上来说,选定任何一种格式作为基本格式都是可以的,HNC选定的基本格式是JK1在第一位,E在第二位,其他的JK依次排在E后,也就是说,两主块句、三主块句和四主块句的基本格式分别是JK1+EJK1+E+JK2JK1+E+JK2+JK3,这一选择是以汉语的习惯为依据的,也符合多数印欧语言的习惯。句类表示式中的语义块排列顺序都采用基本格式。

        在非基本格式中,当两个JK挨在一起的时候,语言表达就有一种内在需要,即需要在两个JK之间加上语义块区分标志符,以划定它们的边界并标明各JK的身份,汉语中的“把”和“被”就是典型的语义块区分标志符,例如在“张三把李四打了”和“李四被张三打了”这两个句子中,两个JKA(张三)和B(李四)挨在了一起,“把”和“被”就起了双重作用,一是分清了AB之间的边界,二是明确了谁是A谁是B。有这样的语义块区分标志符的非基本格式称为规范格式,缺少了语义块区分标志符(也就是该有标志符的地方却没有)的非基本格式称为违例格式。“这个问题我们已经解决了”就是基本作用句XJ的违例格式,因为其B(这个问题)和A(我们)这两个相邻的JK之间没有语义块区分标志符。应该指出,在基本格式中,相邻的JK之间是没有语义块区分标志符的。

        语句格式代码以“!”打头,后加若干位数字,第一位数字表示格式类型,!0表示基本格式,!1表示规范格式,!2表示违例格式,后面的各位数字用于对语义块的各种排序进行编码。下面是三主块句的格式代码和表示式:

        基本格式

        !0J =JK1+E+JK2

        非基本格式

        规范格式

        !11J =JK1+^JK2+E

        !12J =JK2+^JK1+E

        !14J =E+JK2+^JK1

        !15J =E+JK1+^JK2

        违例格式

        !20J =JK2+E+JK1

        !21J =JK1+JK2+E

        !22J =JK2+JK1+E

        !24J =E+JK2+JK1

        !25J =E+JK1+JK2

        式中的“^”表示语义块区分标志符,“J”表示句子。

        还有一种语句格式也算入非基本格式,就是有语义块省略的格式,省略格式!3k表示,k=0表示省略E块,k=m表示省略了JKm3k后面加基本、规范或违例格式代码中的数字串,具体表示是在哪种格式上的省略。如果省略了两个语义块,则在3k后再加3k

        附录三给出了语句格式的区别代码和表示式。

        HNC穷尽了所有可能的语句格式,写出其表示式并加以编码,这样,任何语句的格式就都可以用这些格式代码来描述了。格式代码和句类代码配合,就可以确定地描述一个句子的语义结构,句类代码指明句子有几个什么样的主语义块,格式代码指明这些主语义块的排列顺序。格式代码加句类代码称为语句代码,例如:

        句子 语句代码

        张三打了李四。 !0X

        张三把李四打了。 !11X

        李四被张三打了。 !12X

        这个问题我们已经解决了。 !22X

        红旗漫卷西风。 !20X

        打倒国民党反动派。 !31X

        张三对李四的这种做法十分反感。 !11X20

        在语句代码中,基本格式代码!0可以省略。

        不同的句类对句类格式会有不同的偏好,这就是句类知识中的格式知识。比如汉语中的基本作用句XJ常用!0!11!12格式,而一般效应句Y0J(如“中国队获得了亚军”)则一般只能用!0格式。

        语句格式在词汇层面会有个性表现,由不同词语充当E块核心的句类相同的句子,所能采用的语句格式会有所不同。例如,一般反应句X20J一般可采用!0!11格式,如下面的“关心”句,但“冷漠”句就只能用!11格式。

        一般反应句X20J=X2B+X20+XBC

        她很关心我的生活。 !0

        她对我的生活很关心。 !11

        她对我的事很冷漠。 !11

        在规范格式中,JK之间的语义块区分标志符由语言逻辑概念l0充当,不同句类的不同语义块所使用的l0是有所不同的,这也是格式知识的重要内容,例如,在!11格式下,汉语基本作用句XJJK2B)前常用“把”作标志符,而一般反应句X20JJK2XBC)前就不用“把”,而是常用“对”作标志符。

        !11J=JK1+^JK2+E

        !11XJ=A+^B+X 张三把李四打了一顿。

        !11X20J=X2B+^XBC+X20 她对我的生活十分关心。

2.1.2 语义块构成知识

        语义块构成知识包含四个方面的内容:语义块一般构成、语义块分离、句蜕、块扩,后两者是语义块构成的特殊形式。

2.1.2.1 语义块构成的一般表述

          语义块通常包含核心部分和说明部分,本小节描述的语义块构成仅针对其核心部分。

          广义对象语义块和特征语义块具有不同的构成特性,需要分别描述。

2.1.2.1.1 广义对象语义块的构成

            对广义对象语义块而言,最重要的构成特性是对象和内容的分解,简称JKB-C分解。(pp51)一个广义对象语义块可能分解成对象和内容两部分,其中的对象可能再分解为对象和内容两部分,其中的内容也可能再分解为对象和内容两部分。从理论上来说,这种分解是可以无限进行下去的,如下面的表示式所示:

            JK=JKB+JKC

            JKB=JKBB+JKBC

            JKBB=JKBBB+JKBBC

            JKBC=JKBCB+JKBCC

            ……

            JKC=JKCB+JKCC

            JKCB=JKCBB+JKCBC

            JKCC=JKCCB+JKCCC

            ……

            例如一般反应句(X20J=X2B+X20+XBC)中的XBC可以分解为XBCBXBCC,其中的XBCB可以再分解为XBCBBXBCBC,在“张先生喜欢年轻貌美的李小姐的气质”这句话中,“年轻貌美的李小姐”是XBCB,“气质”是XBCC,“年轻貌美”是XBCBC,“李小姐”是XBCBB

            语义块的构成成分称为块素,用FK表示。一般地,语义块构成表示式中的块素在具体的句子中都有可能省略,如果某块素不能省略,则在它后面打“%”来表示,例如,

            XBC=XBCB%+XBCC

            表示XBCB是不能省略的。这一表示也适用于特征语义块的构成。

            对广义对象语义块进行B-C分解,就是描述它是否包含BC,以及BC是必须有呢,还是可有可无,这是广义对象语义块构成的第一项重要知识。

            广义对象语义块构成的第二项重要知识是其构成的良性与非良性之分。(pp51)所谓良性与非良性构成是指语义块中BC的出现顺序是否固定,如果是固定的,就称为良性构成,如果是不固定的,就称为非良性构成。一定B在前或一定C在前都是良性构成的表现,可能B在前也可能C在前,就是非良性构成的表现。汉语基本作用句的语义块B就具有良性构成的特性,当B中既有对象又有内容的时候,一定是对象在前,内容在后,例如“增强人民体质”、“提高农民的生活水平”、“调整产业结构”等等,都是对象(“人民、农民、产业”)在前,内容(“体质、生活水平、结构”)在后。汉语反应句的语义块XBC就具有非良性构成的特性,“张先生喜欢李小姐的温柔体贴”是对象在前,而“张先生喜欢温柔体贴的李小姐”是内容在前。

            很显然,良性构成的语义块比非良性的容易分析,因为其BC容易确定。

            广义对象语义块也可以有不同对象或不同内容的分解,如双向关系句(详见第7章)的RB就分解为RB1+RB2,也就是关系的双方,是两个不同的对象。

            为了表达的方便,有时候需要对语义块进行形式上的分解,就是把一个语义块分解为前后两部分,分别用QH(取自“前”和“后”的声母)表示,QH都可以再分解为QH,可以如此不断分解下去,如下面的表示式所示:

            K=KQ+KH

            KQ=KQQ+KQH

            KH=KHQ+KHH

            KQQ=KQQQ+KQQH

            ……

            上式中的K代表语义块,包括广义对象语义块(JK)、特征语义块(EK)和辅语义块(fK)。

2.1.2.1.2 特征语义块的构成

            语义块通常由核心部分和说明部分构成,特征语义块也不例外,也就是说,特征语义块不仅仅是述语动词,而是一个结构体,具有复合构成。(pp182,48,124)广义对象语义块(pp45)的说明部分一定在核心部分之前,而特征语义块有所不同,其核心部分的前后都可以有说明部分,HNC把前说明部分叫做特征语义块的上装pp184),后说明部分叫做特征语义块的下装pp186)。特征语义块的构成可以表示如下:

            E=上装+Ek+下装

            Ek表示E块的核心部分,k取自英文的kernal。简单的E块仅有EkEk也是一个结构体,有其复合构成,简单的Ek仅有一个动词。因此,最简单的E块是由一个动词构成的,例如:(“[]”内是特征语义块,下同)

            [告诉]你一个秘密。 国家机构[陷入]危机。

            知识[]一种无形的资产。 工业革命[使]战争工业化。

            下面分别说明E块的上装、下装,以及Ek的复合构成。

2.1.2.1.2.1 特征语义块的上装

 

上装是E块的修饰语,其语义类有(pp184):

    1. 基本判断逻辑修饰 由基本逻辑概念jl1(基本判断)的u型概念充当。jl1有三个子节点:jl11是判断内容,包含是否有无等概念,jl12jl13是判断的势态,前者是纯客观的势态,如可能、必然等概念,后者是含主观的势态,如应该、必须等概念。它们的u型概念分别举例如下
    2. jl11 确实、的确、没有、肯定、不、没、未、会

      jl12 可能、可以、能、能够、也许、一定、必然、必定、偶尔

      jl13 应该、应、应当、必须、要

      这些概念都可以做QE,例如

      日本神户市政府[确实做到了]企业化经营的境界。

      里根革命[没有走到]右派希望达到的境地。

      苏联经济继续遭到失败[肯定将破坏]它的民主革命。

      英国的军火出口额[可能超过了]苏联。

      反动派在僻远地区[偶尔袭击]卡车车队和公共汽车。

      你们[明白]父母的苦心。

      [必须克服]讲话乏味的缺点。

    3. 时态修饰 由语言逻辑概念l6l7充当。l6是静时态,如“正在、正、在、已经、已、曾经、曾、将要、将、要”等。l7是动时态,如“马上、越来越、日见、随即、临时、即将、尽快”等。
    4. 苏联领导人戈尔巴乔夫[正在考虑]英国向他提出的计划。

      海豹[受到]被消灭的严重威胁。

      警方多年来[一直在呼吁]政府早日恢复死刑。

      以色列[兼并]仍在其控制下的西岸部分土地。

      他们[将要付出]沉重的代价。

      他们[已经占领了]阿富汗北部省份。

      行政长官董建华在不久前[呼吁]进行改革。

    5. 语言逻辑修饰 由语言逻辑概念la充当,如“又、也、也是、还、仍、仍然、就、都、再、再次、重新”等。
    6. 总统现在[患上了]肺炎。

      美国[]仍然不让服刑期满的犯人有权参加投票的国家。

      微软在个人电脑市场[不会独占鳌头]

      所有的强力部门[要服从于]总统。

    7. 属性修饰 由基本概念、基元概念或综合概念的uv型、u型或uu型概念充当,可简称为u类上装,如“迅速、超额、彻底、深刻、着重、正确、充分、完全、稍微、十分、直接、趁机”等,其中的uv型和u型一般都与Ek有狭义或广义同行(pp32)关联,uv型概念的同行性更强。
    8. 这座城市[正在迅速发展成为]一个金融和商业中心

      本届亚运会的召开[彻底消除了]这种担心。

      对金融市场在世界上所扮演的角色[应当予以彻底的重新考虑]

      李鹏总理[着重概括介绍了]社会主义市场经济的特点。

      然而差价[不会完全消失]

      叶利钦如今[完全信任]普里马科夫。

      共有16支球队[直接参加]冠军杯赛。

    9. 动词前加成分qv 如“来、去”等,是对空间或效应的说明。

 

我自己[解决]这个问题吧。

起初,金管局以“夹息”[对付]

[了解一下]那里的情况吧。

2.1.2.1.2.2 特征语义块的下装

              特征语义块的下装有两类,一是hv,二是HE

              1hv 是动词后的属性修饰成分,有两类,一是“着、了、过”,是对E块的时态修饰;二是“到、来、出、去”等,它们是对E块的效应和空间特性的说明,这里的“效应”和“空间”是广义的,实际上是基本概念和基元概念两方面的代表。(pp184)现代汉语的第二类hv十分丰富,除上列几个外还有“得、成、住、掉、完、见、开、起、上、下、给、够、好、乱……”等,它们是汉语里最重要的语素。hv大多数为单音节形式,双音节形式的有“一下、起来、进来、出来、上来、下来、进去、出去、上去、下去”等,基本上都是趋向动词。

              6月份,日本[试制]采用碳纳米管的壁挂电视。

              亚运会期间[将用]约十一万个胶卷。

              卢卡斯把特技效果[发展]一种艺术形式。

              我们[要把握]这个难得的机会。 但是他[]压力。

              现在中亚选手[也已经赶了上来] 但捐赠国[迟迟没有]把这笔钱[上来]

              萨洛蒙兄弟公司1981年把这位精英人物从自己的机构里[了出去]

              非洲产品在欧洲以外的地方[卖不出去]

              2HE 是对E块基本特性的说明。基本特性是指以基本概念表达的属性,由Ph(jm)充当。Ph(jm)表示由基本概念(pp25)构成的短语。用于HEPh(jm),最常见的是“时、数、质、度”。(pp186)例如:

              [一连睡了十几个小时]

              他大学毕业后在此[已任教22]

              当时孩子手捧录取通知书趴在炕上[大哭一场]

              涂料的老化时间也[延长了两倍多]

              这一成果将碳纳米管的研究又向前[推进了一大步]

              HNC对语句的理解处理是以句类为指导的,而句类是由特征语义块决定的,因此对特征语义块的感知和确认是切入点,设计上装和下装的中心目标就是服务于此,上述各类上下装都有明确的概念符号表示,可以为E块感知提供简明的激活信息。这一服务目标也是HNC不采用语法学副词、助词等概念的原因。

2.1.2.1.2.3 特征语义块核心部分的复合构成

 

特征语义块核心部分Ek构成的一般表示式如下:

Ek=EQ+E+EH

这个表示式表明,Ek的构成可以有以下五种形式:

1 Ek=E

2 Ek=EQ+EH

3 Ek=EQ+E

4 Ek=E+EH

5 Ek=EQ+E+EH

式(1)表示Ek的简单构成,即仅有一个动词。式(2)表示Ek的并列构成,例如:

作者对美国当今这位最有争议的人物[十分敬慕同情感激]

广大人民群众[坚决支持并积极响应]党的这一号召。

在并列构成中,EQEH可以有各自的u类上装,如“支持”和“响应”前分别有“坚决”和“积极”作修饰。

式(3EQ+E,表示Ek的高低搭配或“vv+v”构成。高低搭配是指EQ是高层概念动词,E是低层概念动词,前者意义不够明确,后者加以补充,二者组合起来构成Ek。在这种构成中,E是主体,Ek的句类由它决定。如“对产业结构[进行调整]”,“进行”和“调整”分别是高层和低层概念,它们合起来做Ek,句类由“调整”决定。汉语中有很丰富的表达高层概念的动词,如“进行、实行、感到、加以、予以、给以、展开、开展、得到、提出、表示、做、作、搞、闹、有”等等,都可以构成高低搭配的Ek。例句:

企业必须对经营机制进行深刻的改造

联合国应该对超级大国的武器实行控制

有些高级军官对戈尔巴乔夫的一些政策感到不满

同时对体育团组出国加以控制

政府不应对此予以全盘否定

墨西哥今后将只对那些挑衅行动给以回击

日本人也针对每周上课五天制展开了热烈的讨论

中美两国将进一步在经济与政治领域开展合作

党内存在的问题并没有得到解决

大家对我们的工作提出了中肯的批评

在苏联,批评家们已对这种政策表示怀疑

军方现在正为恢复军衔制做准备

长期以来,她的丈夫一直在与疾病作斗争

国际奥委会主席萨马兰奇对国际足联的决定很快就作出反应

我们要搞清楚今后的奋斗目标是什么。

克罗地亚一直在闹分裂

人民的生活水平了很大提高

他在建立苏联椥鹄橇酥?U>起过重要作用

他也不应对我们准备这样做的事实抱有任何怀疑

vv是一类特殊的动词,它要求后面必须补充另外一个动词v才能构成Ek,该Ek的句类由后面的v决定,如“试图、企图、试着、被迫、善于、敢于、应邀、带头、设法”等,这些动词只能做vv使用,称为纯vv动词。另外还有兼类的vv动词,它们有vv的用法,但也可以独立充当Ek,如“开始、努力、准备、产生、构成、加强、提高”等。例句:

外国朋友试图说服他们留在国外。

滁州化纤厂于1992年底被迫停产

日本从1989年度起开始研制超音速运输机。

老师的理想和追求会对学生产生直接的影响

中国也不会对任何国家和地区构成威胁

人民银行各级分、支行对收购资金供应工作要加强协调和监督

广大市民要对反动分子的宣传提高警惕

vv类动词是为工程需要而提出的,它们是工程意义下的高层概念。真正的高层概念在句中只具形式意义,可以完全置之不理而不影响语句的基本意义,vv类动词则不同,它们实际上是语句基本意义的重要部分,把vv作为全局E,后面的vJK句蜕中的局部E(全局E、局部E和句蜕的概念见2.1.2.3节),或者把vvv合起来形成混合句类,这样分析都是可以的,但从理解处理来讲,先置vv的意义(句类)于不顾,而仅以后面的v为中心做句类分析,这样更简明,能够在第一步就抓住句子的总体框架,便于对句子进行全局联想处理,这是处理的策略性需要。

式(4E+EH,表示Ek的动静搭配构成。动静搭配是指E是动词(动态),EH是非动词(静态),二者组合成Ek,如“感兴趣”,“感”是动态概念,“兴趣”是静态概念,它们合起来做Ek。在这种构成中,Ek的句类由静态概念EH决定。Ek动静搭配构成在汉语中也很常见。例句:

人们不再对柏拉图的著作感兴趣

一场悄无声息的“战争”早已在纳米领域拉开序幕

国商不得不在帐目上大做手脚

中国与莫斯科向美国施加了一定的压力

撒切尔夫人给苏联官员留下了深刻的印象

他们对工业和经济企业的失败负有不可推卸的责任

这些基层的卫生医护人员对于短期的防疫工作仍然充满信心

厂里的领导班子从一开始就闹矛盾

因为工资低,岗位差,他常常闹情绪

高低搭配和动静搭配之间有时候会出现两可的情况,例如“产生影响”和“起作用”,由于“影响”和“作用”是动名兼类的,可以看作高低搭配,也可以看作动静搭配,两个都可以,任选一个即可,不会带来理解处理结果的差异,但为了工程上的便利,HNC约定,动静搭配中的“静”必须是纯体词,不能与动词兼类,这样一来“产生影响”和“起作用”就都是高低搭配了。

式(5EQ+E+EH,表示Ek高低动静搭配构成。这是最复杂的Ek构成,是高低搭配和动静搭配的交叉组合,例如“持怀疑态度”,EH“态度”和E“怀疑”是高低搭配,EQ“持”和EH“态度”是动静搭配。在这种构成中,E是中心,句类由它决定。例句:

大多数媒体都对这一解释持怀疑态度

明石康对波黑和平持乐观态度

白人极右势力对新南非持仇视态度

也门政府对联合国将要采取的行动持反对态度

县政府对农村家庭养殖业的发展采取了一系列鼓励措施

这一代年轻人对社会和国家的教育有抵触和反感心理

妇女子宫对胎儿内耳有保护作用

苏联的核武器对周边国家起着威慑作用

恢复死刑可对潜在的犯罪分子起威慑和抑制作用

他的表演给人以耳目一新的感觉

金发碧眼的同行们对他的成绩大有望尘莫及的感觉

在语句格式上,Ek由高低搭配、动静搭配以及高低动静搭配构成的三主块语句,一定不能采用JK2在最后的基本格式,最常用的格式是!11,也就是说,这种语句的宾语一定不能放在句尾,而是多以介宾短语的形式置于E块之前。“vv+v”构成Ek的语句,纯vv的都能用基本格式,兼类vv的分为两类,一类以“开始”为代表,常用基本格式,另一类以“产生”为代表,不能用基本格式的,如“产生影响、构成威胁、加强管理”。

HNCEk复合构成的提出或发现具有十分重要的意义。首先,它是HNC建立语句表示式的关键举措之一。举例来说,“国家调整产业结构”和“国家对产业结构进行调整”,两句话的意义相同,它们的语句表示式也应该相同,也就是应该有同样的EJK。如果不采取Ek复合构成的方式,那么“进行”和“调整”就分立成两个语义块,两个句子语义块的数量就不一样了,自然就不可能有同样的语句表示式。有了高低搭配复合构成的概念以后,“进行”和“调整”合为E,而且其中心在“调整”,这样,两个句子的表示式就一致了。

其次,Ek复合构成符合语句理解的事实。从语句的总体语义结构和基本意义及其理解处理来看,高低搭配和动静搭配的Ek必须作为一个整体来看待,而不应该(也没必要)把它们分解成动宾结构,尤其不应该只以高低之高或动静之动为语句的中心。在局部语法形式上,它们确实是动宾结构,但这个动宾并非全句之述语和宾语,它们的组合才是全句的述语,其宾语是另外的成分。

第三,Ek复合构成是语句表达的必然需要,是各种语言都会有的普遍现象,只是“偏好”和具体表现有所不同而已。西语就同样有EQ+E构成。例如

The food we eat seems to have profound effects on our health.

所吃的食物似乎对我们的健康有深远的影响。(引自黄曾阳1999

这个句子的特征语义块是seems to have profound effects,其中的seems跟后面的部分分别是EQEseems是中心动词,但它显然不是句子的语义中心。可见,西语形式上的中心动词不一定是特征语义块的核心,以它为中心进行语句理解处理可能是没有意义的,过分强调其中心作用其实是一种严重的失误,这充分表明,如果仅做形式上的句法分析,可以说西语比汉语方便,但对理解处理来说,西语并不比汉语有优势,所谓汉语述语动词辨识之难,并不是语句理解处理的关键和实质性问题,语句理解处理的实质性第一步,不是找到述语动词,而是要确定特征语义块的核心,并据此进行句类分析,也就是进行语句级概念联想脉络的处理。西语也有动静搭配的Ek,上例中的have effects就是,这种构成其实是很常见的,如“pay attention to, take care of, have a rest”等等都是。

第四,Ek的复合构成表明,“特征语义块的完整表达与单个中心动词完全是两回事,一个完整的特征语义块核心的表达有时不仅需要多个动词,而且还需要体词的配合”,这是HNC的特征语义块概念不能以述语动词代之的根本原因之一。

2.1.2.2 语义块分离

          语义块一般是封闭的,也就是说同一语义块的各个构成部分一般是相连的,但有时候其中的某个部分会分列到另外的位置,这就是语义块分离。换句话说,语义块分离就是同一语义块的不同构成部分之间插入了另外的语义块,插入的语义块可能是一个或多个语义块(包括主语义块和辅语义块),也可能是语义块的一部分(包括核心部分和说明部分)。

          特征语义块和广义对象语义块都可能发生分离,但有一个重要差别:语义块分离一般跟特定的语句格式相关联,特征语义块的分离在基本格式和非基本格式下都可能发生,而广义对象语义块的分离只在非基本格式下发生。

2.1.2.2.1 广义对象语义块的分离

            看下面的句子:

            李四的腿被张三打断了。

            李四被张三打断了腿。

            这是!12格式的基本作用句,表示式是:!12XJ=B+^A+X,“张三”是A,“李四的腿”是B,第一句中没有语义块分离,第二句中B语义块的一部分“腿”分离到了特征语义块“打断了”的后面。

            语义块分离现象的存在从一个方面说明了“语义块”这一概念的重要性,以及它与短语的重要差别,在上例中,只有有了语义块的概念后才会认识到“李四”和“腿”是分离了,它们本来应该是同一个语义块的构成部分。如果没有语义块的概念,怎么说明它们是同一个单位呢?

            广义对象语义块分离出去的部分有三种可能的存在状态,一是独立存在(如上例中的“腿”),二是融合到别的语义块中,三是变成辅语义块,下面的例句是后两种情况。

            联合国对伊拉克进行了经济制裁。

            法西斯的暴政在当地人民的心中激起了愤怒。

            第一个句子中,JK2(“伊拉克的经济”)的一部分“经济”分离出去,融合到了特征语义块“进行了制裁”的内部。第二个句子中,JK2(“当地人民心中的愤怒”)的一部分“当地人民心中”分离到特征语义块“激起了”的前面,而且变成了辅语义块的形式。如果把分离的语义块合并起来,上面的句子就是:

            联合国对伊拉克的经济进行了制裁。

            法西斯的暴政激起了当地人民心中的愤怒。

            语义块分离显然构成了语句理解处理的一大难点,对分离的处理,首先是发现,然后是还原。句类知识中必须为分离处理提供明确的判断依据,具体内容有四个方面:第一,什么条件下分离,这个条件主要是语句格式的不同;第二,可以分离,还是一定分离;第三,分离到何处,或者说中间插入了什么;第四,分离出去的部分以何形态存在,是独立存在呢,还是融合到其他语义块中。

            下面对特征语义块分离的阐述就是围绕以上四个方面进行的。

2.1.2.2.2 特征语义块的分离

            特征语义块的分离十分常见,上装、下装和复合构成的Ek都可能发生分离,最常见的是上装的分离。

2.1.2.2.2.1 上装的分离

              在规范格式下,基本判断逻辑修饰(jl1)和时态修饰(l6l7)一定分离到第一个广义对象语义块(JK)标志符之前,语言逻辑修饰(la)和动词前加成分qv可以分离,属性修饰一般不分离,一般来说,属性修饰与Ek的同行性越强,分离的可能性就越小。例如:(分离出去的部分用下划线标出,下同。右列的句子是未发生分离的情况。)

              [应该]把他们[培养成]出色的体育人才。

              政府[必须]对市场物价[进行调控和管理]

              营业室的铁栅门[]被歹徒[关上]

              迎宾人员[会马上]向你[递上]一份当日节目表或一周的节目安排。

              []把那份材料[翻阅了一遍]。 我把那份材料[又翻阅了一遍]

              []给大家[解释一下]这个问题。 我给大家[来解释一下]这个问题。

              [狠狠地]把儿子[揍了一顿]。 他把儿子[狠狠地揍了一顿]

              我要[无私地]把艺术[献给]人民。 我要把艺术[无私地献给]人民。

              在基本格式下,当第一个JK和特征语义块之间有带标志符的辅块时,jl1l6l7一般必须分离到此标志符之前,laqv可以分离,属性修饰则一定不分离。

              [必须]以有力措施[反对]牟取暴利型价格。

              当年面临的市场压力[]在新的条件下[回到了]他们身边。

              当年面临的市场压力在新的条件下[又回到了]他们身边。

              在规范格式下,当第一个JK后有带标志符的辅块时(该辅块一定位于带标志符的JK之前),jl1l6l7一定分离到辅块或JK标志符之前,laqv可以分离,属性修饰则一定不分离。

              你们[必须]在天亮前把文件[打印出来]

              我们[一定不能]在经济富裕以后[]把农业[丢掉]

              在今年上半年[就能够初步]把数据资料[汇总]

              农水省早在3月份[]把研究课题[分配给]各试验场。

2.1.2.2.2.2 下装的分离

              单音节的hv,除“来、去”外都一定不分离,“来、去”和双音节的hv偶尔会分离到后面的JK之后。

              你给我[]本好看的[]。 他从口袋里[掏了]三百块钱[出来]

              HE有时会分离到后面的JK之后,经常分离的是由数量短语充当的HE

              [看了][一眼]。 他[狠狠地揍了]儿子[一顿]

2.1.2.2.2.3 Ek的分离

            简单构成的Ek不可能分离,在复合构成的Ek中,并列构成EQ+EH和高低动静搭配构成EQ+E+EH一定不分离。

            高低搭配EQ+E的分离

            EQE之间可以插入整个宾语或宾语的一部分,如例(1)是插入了整个宾语“国有企业产业结构”,例(2)是插入了宾语的一部分“产业结构”。插入的宾语和E可以融合,二者之间的“的”是融合的标志。当插入的是整个宾语时,该宾语前可以有标志符,如例(3)中的“对”,有标志符的时候,宾语与E就一定融合,也就是说其间的“的”必须有。插入的宾语前有标志符,语句就是规范格式,所以这时候应该看作是EQ向前分离,而不是E向后分离。

            1)中国[正在进行]国有企业产业结构(的)[调整]

            2)中国[正在]对国有企业[进行]产业结构(的)[调整]

            3)中国[正在进行]对国有企业产业结构的[调整]

            vv+v”搭配EQ+E的分离

            如果EQ是纯vv,在基本格式下,EQE之间可插入辅块,如例(1),在规范格式下,EQ一定分离到宾语前,而且EQ和宾语之间还可插入辅块,如例(2);如果EQ是兼类的vv,以“开始”为代表的一类,和纯vv具有同样的分离特征,以“产生”为代表的一类只能用!11规范格式,EQ可以分离到宾语之前,此时E一定与宾语融合,如例(3)

            1)他[试着]在实验田里[栽培]绿化树苗。

            2)他[善于]用简练的语言把复杂的问题[讲清楚]

            3)有关部门和学校[必须进一步提高]对艺术教育重要性的[认识]

            动静搭配E+EH的分离

            在基本格式下,EEH之间可插入整个宾语,宾语与EH融合,如例(1),也可能插入主语的一部分,如例(2);在规范格式下,EEH之间可插入宾语的一部分,如例(3),也可以插入整个宾语,此时宾语与EH一定融合,如例(4)

            1)林业[肩负着]保护环境与发展经济的[重大使命]

            2)张老师[刚做了]心脏[手术]

            3)医生给病人[做了]心脏[手术]

            4)每一位公民[都应当负起]对社会安全的[责任]

            应该强调指出,高低搭配和动静搭配构成的Ek,其分离具有很强的词语个性,不能一概而论,在词语知识库中必须针对具体词语对分离知识给出具体而明确的表示。

            汉语特征语义块的分离还有一种十分重要的情况:在双向关系句、双向替代句和交换句中,E块的分离部分常常分离到语义块RB(关系双方)或T4B(替代或交换的双方)内的l43(“和、与、跟、同”等)之前,如在例(1)中,“张先生和李小姐”是RBE块的上装“就要”分离到了l43“和”之前。

            1)张先生[就要]和李小姐[结婚了]

            2)李泽楷[已经]与英特尔公司[达成]协议。

            3)对这些部门的管理[已牢牢地]与普里马科夫[联系在一起]

            4)我[曾经试图]与他的教练和朋友[谈谈]

2.1.2.2.3 语义块分离的表示

          在语义块的构成表示式中,对分离块素做出标记,表达分离知识,约定以下表示:

          [FK] 可能分离

          [(FK)] 一定分离

          [>,FK] 向后分离

          [<,FK] 向前分离

          [n,FK] 分离到JKn后,

          n=0表示分离到句首,n=9表示分离到E块后

          [*n,FK] JKn吸收,n=9表示被E块吸收

          [*,FK] FK被就地吸收(融合到紧邻的前一语义块中)

          [**,FK] 分离出去后插入到E块的QH之间

          [**Q,FK] 分离出去后插入到EQ的内部

          [**H,FK] 分离出去后插入到EH的内部

          [**K,FK] 分离出去后插入到E核心词语中

          [**n,FK] 分离出去后插入到JKn

          [**nQ,FK] 分离出去后插入到JKnQ

          [**nH,FK] 分离出去后插入到JKnH

          其中FK是分离出去的块素。例如,以“打断”为Ek的句子,其B语义块由XBYB构成,YB可能分离到特征语义块后,这一知识表示如下:

          B=XB+[9,YB] 李四被张三打断了腿。

2.1.2.3 句蜕

          句蜕是指一个句子蜕化为语义块或语义块的一部分。句蜕有两种基本类型:原型句蜕和要素句蜕。原型句蜕是一个句子蜕化后仍保持原来的形式,例如“我知道张三打了李四”,这个句子的JK2是由句子“张三打了李四”蜕化来的,形式上跟蜕化前完全一样,是原型句蜕。要素句蜕是以某个语义块为中心语,其他语义块为修饰语的句蜕,例如“老师批评了打李四的张三”,这个句子的JK2是由句子“张三打李四”蜕化来的,蜕化后原句的JK1(张三)成为中心语,另外两个语义块EJK2(打李四)成为修饰语。以广义对象语义块为中心语的要素句蜕称为JK要素句蜕,以特征语义块为中心语的要素句蜕称为E要素句蜕。

          基本句蜕的前面或后面如果加上别的成分,就形成包装句蜕。原型句蜕加包装就称为原型包装句蜕,要素句蜕加包装就称为要素包装句蜕。例如,“我知道张三打了李四这件事”,这个句子的JK2“张三打了李四这件事”就是原型包装句蜕,“这件事”是包装部分。“老师不相信打了李四的张三的话”,这个句子的JK2“打了李四的张三的话”就是要素包装句蜕,“的话”是包装部分。

          下面是句蜕表示的符号约定,其中的EJ表示句类代码:

          原型句蜕 {EJ} 要素句蜕 <EJ>

          包装句蜕 \EJ/ 句蜕一般表示 (EJ)

          E要素句蜕 <EJE> JK要素句蜕 <EJK>

          原型包装句蜕 \{EJ}/ 要素包装句蜕 \<EJ>/

          下面再给出一些上述各种句蜕的例句:

          原型句蜕

          政府和民间经济研究所都相信{信息技术会促进经济增长}。

          {增加税收}会导致{物价上涨}。

          要素句蜕

          JK要素句蜕

          <生产信息技术产品的工厂>都转移到了国外。

          <国内获得的世界最新信息>急剧减少。

          <经济危机造成的后遗症>也随之减轻。

          <参加这次会议的代表>都是各单位的科研骨干。

          这种批评是<我们付出的代价>

          E要素句蜕

          这些话语似乎表示了<他对奴隶的同情>

          <税收的增加>会导致<物价的上涨>

          原型包装句蜕

          我们的眼睛成为\{交流感情}的工具/

          作者就是\{出版社生存}的前提/

          要素包装句蜕

          \<量子电脑的研制>工作/现在还处于十分原始的阶段。

          能耗限制了\<计算机的运行>速度/

          \<世界转基因作物的种植>面积/也在增加。

          要素句蜕,特别是JK要素句蜕,是最常见和最重要的句蜕类型。

          如果一个句子中有句蜕,那么可把这个句子的特征语义块称为全局E,用Eg表示(g取自英文global),把句蜕中的特征语义块称为局部E,用El表示(l取自英文local)。

          对句蜕的处理就是要把它作为一个句子来分析和理解,而不是仅仅分析为定中之类的短语结构。一个语义块中如果有句蜕,就意味着它蕴含了一个子句,不管该句蜕以何种格式存在,都要对它进行跟句子一样的理解处理,也就是要首先确定其句类和各个语义块。一个语义块会不会包含句蜕,是什么类型的句蜕,句蜕由什么句类蜕化而来,这是语义块构成知识的重要内容。

          可以把包含句蜕的语义块称为句蜕语义块,简称句蜕块。句蜕块的复杂程度有所不同,可以分为以下六种类型,各类型的复杂程度依次递增。

          0 语义块=原型句蜕或要素句蜕

          1 语义块=包装句蜕

          2 语义块=变形句蜕

          3 语义块的一部分=句蜕

          4 语义块=句蜕嵌套

          5 语义块的一部分=句蜕嵌套

          0型句蜕语义块是整个语义块由一个简单的原型或要素句蜕构成,这样的语义块一般是容易分析的,在很多情况下,它比由多个体词组合成的语义块更容易分析。2型中的变形句蜕是指伴随着语义块分离、句类转换或语义块并合现象的句蜕。例如,

          公安部门查封了<[那些]出售盗版光盘的书店>

          句中尖括号内是个句蜕块,是一个由“那些书店出售盗版光盘”蜕化来的要素句蜕,其JK1“那些书店”在句蜕中发生了分离。

          与变形句蜕相比,一般的句蜕可称为常规句蜕。上列345型句蜕块中的句蜕包括常规句蜕和变形句蜕。

          句蜕嵌套是指句蜕中的某个语义块又包含句蜕,例如,

          \{家长给<即将入学的孩子>送喇叭筒}的习俗/起源于100多年前。

          \{阻挠{副总统梅加瓦蒂接管领导权}}的活动/也在不断加剧。

          第一句话是一个素描句P11JPB+P11+P1C,其PB是规范格式的物转移句(!113T2J=TA+^TB+T2+T2C)的原型包装句蜕,这个句蜕中的TB又是个要素句蜕,它蜕化前的句子是“孩子即将入学”,这是个过程句与状态句的混合句类,其表示式是P1S*10J=SB+P1S。第二句话是一个效应句Y01J=YBC+Y01,其YBC是省略了A的基本作用句(!31XJ=X+B)的原型包装句蜕,这个句蜕中的B又是个原型句蜕,该句蜕是替代句和基本作用句的混合,表示式为T4a1X*22J=T4B1+T4a1X+T4BC2

2.1.2.4 块扩

 

从字面上来说,块扩就是语义块扩展为句子,HNC对块扩的定义是在这一字面意义的基础上增加了两个限制条件:第一,只有JK2JK3才会块扩;第二,只有某些特定的句类才会块扩。这样定义的目的在于把块扩特性赋予特定句类的特定语义块,使之成为句类层面的先验知识。

具有块扩特性的句类称为块扩句类。在57个基本句类中,只有10个块扩句类,其中8个是无条件块扩句类,2个是有条件块扩句类。

8个无条件块扩句类是:作用效应句、信息转移句、块扩判断句、扩展单向关系句、扩展双向关系句、扩展替代句、扩展双向替代句和后续反应句。下面是它们的句类表示式和例句,块扩的语义块用“##”标出。

作用效应句

XYJ=A+X+B+#YC#

这一财政政策将迫使银行#增加货币供应量#

信息转移句(包括T30T31T32

T3J=TA+T3+TB+#T3C#

有关方面的负责人告诉记者,#中国已经获得了主办权#

块扩判断句

DJ=DA+D+#DBC#

有关专家认为#这项技术解决了该领域的三大技术难题#

扩展单向关系句

Rm100J=RB1+R+RB2+#RC#

张先生会同李小姐#前往巴黎#

Rm101J=RB1+R+RB2+#RC#

他带领着几位同事#四处寻找合作伙伴#

Rm100J=RB2+R+RB1+#RC#

李小姐陪张先生#去上海了#

扩展双向关系句

Rm0=RB+R+#RC#

我们将与贵公司合作#开发海底石油资源#

扩展替代句

T4a10J=T4B1+T4a+T4B2+#T4C#

张三代李四#领了工资#

扩展双向替代句

T4a0J=T4B+T4a+#T4C#

医院的护士们每日24小时轮流#对徐洪刚进行特别护理#

后续反应句

X200J=X2B+X2+#X2C#

李小姐吓得#不敢说话#

2个有条件块扩句类是:

一般反应句

X20J=X2B+X20+#XBC#

我们希望#拥有和平的国际环境#

一般效应句的子类Y30

Y30J=YB+Y+#YC#

抽查结果表明#大型企业产品质量明显提高#

X20J块扩的条件是,特征语义块核心是v7121(待实现的愿望,如“希望、祝愿、幻想”等)。Y30J块扩的条件取决于概念节点331的特定动词。

在块扩句类中,全局E和局部E之间具有广义因果关系,因此可以把全局E称为Epp取自premise),把局部E称为Err取自result)。

一个语义块具有块扩特性,意味着它在概念上需要一个句子来表述,在具体的句子中,这个语义块可能不是一个句子,但它必定蕴涵着一个句子,这个句子的意义必定在上下文中有所表达。例如,在信息转移句“张三告诉李四一个好消息”中,T3C“一个好消息”不是句子,但这个消息的具体内容就需要用句子来表达。

在形式上,块扩跟原型句蜕是一样的,它们的重要区别在于:原型句蜕可以变换为要素句蜕,而块扩不能,块扩只能变换为包装句蜕。例如,

增加税收会导致物价上涨。 => 税收的增加会导致物价的上涨。

张三告诉李四王五去上海了。 => 张三告诉了李四王五去上海的消息。

上句的JK1JK2都是原型句蜕,都可以变换为要素句蜕。下句是块扩变换为包装句蜕。

2.1.3 语义块之间的概念关联知识

        语义块之间的概念关联知识分为两类,一是特征语义块与广义对象语义块之间的关联,二是广义对象语义块之间的关联。第一类关联就是特征语义块对广义对象语义块概念优先性的预期,这是最重要的概念关联知识,例如反应句中的反应者X2B必须是人(广义,包括人的个体和社会形式,如组织机构等)或动物,以及生命体的部件。第二类概念关联,比如关系句中的关系双方RB1RB2常常具有对仗性,也就是说,如果RB1是人,那么RB2也应该是人,如果RB1是物,那么RB2也应该是物。可见,概念关联知识就是描述句类中的语义块应该是什么概念(可称为概念优先性),以及语义块之间的相互制约关系。

        对概念关联知识的描述采用HNC建立的概念表述符号体系,而不是用自然语言的词语或句子,例如,反应句X2B的上述概念优先知识是以下列形式表达的。

        X2B: pp;jw62;jw6m-

        其中的pp包含了p(人)、pe(组织机构)和pj2(国家)等,jw62表示动物,jw6m-表示生命体部件。这些符号称为概念类别符号,附录四给出了常用的概念类别符号。

        应该说明,语义块之间的概念关联知识只描述语义块的核心部分,不包括其说明部分。

2.1.4 句类转换和语义块变换知识

 

句类转换是指甲句类的内容换用乙句类来表达。看下面两个句子:

张先生赏识李小姐的办事能力。

=> 李小姐的办事能力受到张先生的赏识。

前一句是一般反应句X20J=X2B+X20+XBC,后一句是一般承受句X10J=X1B+X10+XBC,它表达的内容也是“张先生赏识李小姐的办事能力”这一反应,这就是一般反应句向一般承受句的转换。转换前后两句类之间的语义块对应关系是:反应句的XBC(李小姐的办事能力)转换为承受句的X1B,反应句的X2B(张先生)和X20(赏识)转换为承受句的XBC

提出句类转换的概念就意味着,在语句的分析理解过程中,要对转换句类进行反转换处理,就是要还原出转换前的那个句子,分析出语义块之间隐含的语义关系,比如上面的承受句,其JK1JK2之间隐含着“张先生赏识李小姐的办事能力”这一反应,只有经过反转换处理才能揭示出这一语义关系。

甲语言的某句类在乙语言中可能需要用另一句类来表达,所以,翻译中也会需要进行句类转换。比如汉语的简明状态句S04J=SB+SC,翻译成英语就要转换为是否判断句jDJ=DB+jD+DC,如下面的例句所示:

李小姐很漂亮。 => Miss Li is quite beautiful.

她的头发很长。 => Her hair is very long.

形势险恶。 => The situation is dangerous.

今天阳光灿烂。 => It’s sunny today.

句类转换的代码约定为(Et,E),其中E是转换前句类的代码,Et是转换后句类的代码,上面那个一般反应句向一般承受句转换的句子就可以表示为 (X10,X20)J

对句类转换知识的描 述就是要研究一种语言中存在哪些句类之间的转换,对翻译来说,则要研究两种语言之间需要进行什么样的句类转换。

汉语中常见的句类转换有反应句向承受句的转换、基本作用句向承受句的转换、各种句类向是否判断句的转换等。下面是几个向是否判断句转换的例句。

jD,X

人民创造了历史。 => 历史是人民创造的。

jD,X20

张先生喜欢李小姐。 => 张先生喜欢的是李小姐。

jD,T2b

克林顿总统昨天上午到达北京。

=> 克林顿总统是昨天上午到达北京的。

语义块变换是指主语义块和辅语义块之间的变换,有主变辅和辅变主两种情况。

主变辅可能是整个主语义块变成辅语义块,也可能是主语义块的一部分分离出去后变成辅语义块,下面两个句子分别属于这两种情况。

英国在香港统治了一个半世纪。

法西斯的暴政在当地人民心中激起了愤怒。

第一句是关系作用句R411X*21J=RB1+RX+XB,它的XB是“香港”(即“香港”应该是“统治”的宾语),在句中变换成了辅语义块“在香港”。第二个句子在上文讲述语义块分离时曾分析过,其JK2的一部分“当地人民心中”分离出去,变换成了辅语义块。

辅变主可能是辅语义块变换为整个主语义块,也可能是辅语义块变换为主语义块的一部分,下面两个句子分别属于这两种情况。

东亚地区出现了信息技术革命的浪潮。

信息技术在现代军事中的作用已经超过了武器装备。

第一个句子是一般效应句Y10J=YB+Y+YC,其中的“东亚地区”本来是辅语义块,现在变换成了主语义块YB,把它还原成辅块后,这个句子就是“信息技术革命的浪潮在东亚地区出现了”。第二个句子是个比较判断句jD00J=DB1+jD0+DB2,其中的“在现代军事中”本来是辅块,现在变换成了主块DB1的一部分,把它还原成辅块后,这个句子就是“在现代军事中,信息技术的作用已经超过了武器装备”。

常见的辅变主就是辅语义块变换为主语义块的修饰部分。

对语义块变换的处理就是要把变换了的主块或辅块还原回去,比如主块整个变为辅块时,句子就会在形式上缺少了一个主块,这个主块需要从辅块中还原回来,这样才能实现对句子的理解处理。

2.2 关于句类知识的若干问题

2.2.1 句类知识的系统与层次

        57个基本句类为纲,以语义网络的概念节点为目,这就是句类知识的系统。每个句类有自己的共性知识,同一句类的特征语义块核心可以来自不同的概念节点,E核心的概念不同,句类知识也会有所不同。例如,反应句的X2B必须是人(广义,包括人的个体及社会形式)、动物或生命体部件,如果反应句的E核心是7行的概念(心理活动和精神状态),那么X2B就一定是人的个体。因此,对句类知识的描述就以句类为纲,概念节点为目而形成系统。本文第39章对句类知识的阐述就是按这个纲目展开的。

        句类知识有两个层次,一是概念层面,二是词汇层面,前者取决于句类和E核心的概念,后者取决于E核心的具体词语。与概念层面相比,词汇层面的句类知识会更具体化和个性化。HNC词语知识库的核心内容是句类知识,它以概念层面的句类知识为基础,突出词汇层面的句类知识,概念层面体现共性知识,词汇层面体现个性知识,后者是对前者的细化和补充,而不应该产生矛盾,这是在词语知识库中描述词语知识时应遵循的第一条原则。例如,在概念层面,信息转移句T3J的转移内容T3C具有块扩特性,在词语知识库中,如果某个词语形成的是T3J,那么其T3C就必须符合块扩这一共性知识,否则就是矛盾的,避免矛盾的方法是用混合句类T3Y3J来描述T3C不块扩的信息转移句(详见第五章)。

2.2.2 句类知识的语种个性

        上述四大项句类知识中,语义块之间的概念关联知识是与语种无关的,不会因语种的不同而不同,另外三项是与语种有关的,语种不同,其具体表现也会有所不同。下面举例说明这三项句类知识的语种个性。

        语句格式知识的语种个性。日语的基本格式是特征语义块在最后,而不像汉语和多数印欧语一样,特征语义块在第二位,这是语句格式语种个性的生动表现。与西语相比,汉语的语句格式丰富得多,特别是广义作用句,如果是三主块句,汉语有基本格式!0、规范格式!11!12,如果是四主块句,汉语则有基本格式以及!113!114!133等常见的规范格式,(这是从句类层面来说的,词语层面会有个性表现,也就是说并非任何一个句子都能变化出这些格式)西语则不管是三主块句还是四主块句,都只有两种格式,就是基本格式(主动式)和一种规范格式(被动式)。下面的例句说明了汉语格式的丰富多彩,如果翻译成英语就简单多了,不是主动格式就是被动格式。

        !0 八路军赶跑了鬼子。

        !11 八路军把鬼子赶跑了。

        !12 鬼子被八路军赶跑了。

        !0 张先生送给李小姐一束鲜花。

        !113 张先生给李小姐送了一束鲜花。

        !114 张先生把鲜花送给了李小姐。

        !133 那束鲜花让张先生送给李小姐了。

        汉语丰富的语句格式似乎给理解处理带来了额外的困难,其实不然,因为汉语有发达的语义块标志符,如“把、被、对、向、由、给、为”等,这些标志符的使用为语义块的辨认提供了明确的信息。汉语发达的语义块标志符是西语所没有的,这是与汉语语句格式的多样性相适应的。

        语义块构成的语种个性。句蜕格式的差别最能说明语义块构成的语种个性。汉语和西语要素句蜕的规范格式分别是:

        汉语 <EJ>=(EJ-Kn)+的+Kn

        西语 <EJ>=Kn+关系代词+(EJ-Kn)

        汉语是把句子的一个语义块Kn放在后面作中心语,其他的语义块EJ-Kn放在前面作修饰语,中间加“的”作组合符号,西语是把Kn放在前面,EJ-Kn放在后面,中间加关系代词作组合符号。

        句类转换的语种个性。汉语中最常见的句类转换就是反应句或基本作用句向承受句的转换,英语中则不存在这种转换,所以汉语的这种转换句翻译成英语时都要用转换前的句类表达(一般用被动式),下面的例句说明了这一点。

        罗素在家里得到父亲的指导。

        Russell was tutored by his father at home.

        美国的言论遭到世界人民的强烈反对。

        The words of USA was opposed deeply by the people all over the world.

2.2.3 句类知识的获取

        句类知识如何获得?对这个复杂的问题,这儿只说明三点:

        第一,句类知识的获取不能只靠对语言事实的归纳和总结,而是要把演绎和归纳的方法结合起来,对概念层面的句类知识来说,在概念空间的演绎思考是主要的方法,语言事实主要用于对演绎结果的验证。词语层面的句类知识比较多地依靠考察和总结语言事实,但它仍然以概念层面的句类知识为指导,很多情况下并不需要总结语言事实或在语言事实中进行验证,例如来自7行(心理活动和精神状态)概念的一般反应句,其X2B一定是人,如果一个词语属于7行,那么它形成的反应句的X2B的概念优先性还需要去归纳或验证吗?

        第二,句类知识的主体不是靠大规模真实语料的统计所能得到的,而且,很多句类知识是没必要进行统计即可明确的,比如上述一般反应句X2B的概念优先知识,概念层面是完全明确的,何必费力地去统计呢?

        第三,句类知识的赋予。所谓赋予,就是约定某个句类具有某项知识,有两种做法,一是纯洁化,就是为了使某句类的知识更加明确和突出而约定它有某项知识,把不符合这项知识的情况用混合句类来表达,例如基本作用句的A本来是可能含C也可能不含C的,为了使之纯净化,就约定A一定不显含C,显含C的情况用混合句类YX来表达。第二种做法是另立名目,就是为某项句类知识专门设立一个基本句类,例如块扩判断句DJ就是为DBC有块扩特性的一般判断句而专门设立的。

2.2.4 句类知识与句类分析

        句类分析是HNC的语句处理策略,其流程可以简要概括如下:第一步,语义块感知,就是找出句中的v概念,然后根据那些可能是全局Ev假设出句子的句类,这些假设是一个候选集;第二步,句类检验,把假设出的句类的预期要求跟现场信息进行比较,从而选定哪个假设是对的,也就确定了句子的句类;第三步,分析语义块的内部结构。这个处理策略可概括为“中间切入,先上后下”三部曲,“中间切入”就是从感知v入手,“先上”就是先确定句类,“后下”就是后分析语义块构成。(晋耀红1998

        在句类分析过程中,句类知识起着全局性的指导作用,特别是在第二步中通过检验确定句类的时候,关键的判断依据就是句类知识,可以说,没有句类知识就没有句类分析,就不可能实现对自然语言语句的理解处理。例如,如果一个句子中有两个v,而第一个v的句类是块扩句类,那么据此就可以毫无疑问地断定,这个v就是全局E,它的句类就是句子的句类,这就是句类知识所起的关键作用。

2.2.5 句类知识的应用

      简单地说,句类知识的作用就在于它使句类分析获得了预期能力,这种预期能力在自然语言理解处理中可以得到广泛的应用。下面举一个简单的例子说明句类知识在专名识别中的应用。

      徐怀钰希望记者不要再炒作此事。

      句中的“徐怀钰”是个未登录的词,这是个一般反应句,根据反应句的句类知识,即X2B的概念优先知识,就可以断定“徐怀钰”是个人名。与基于统计的专名识别方法相比,这一判断是非常简明而可靠的。

      本文的第十一将通过实例说明句类知识的应用。

2.3 句类知识通则

 

本节阐明一些不依赖于特定句类的句类知识,称之为句类知识通则,它们都是重要的句类知识理性法官。所谓句类知识的理性法官就是指那些具有本征意义的句类知识。各句类也有自己的理性法官。

 

01 广义作用句具有规范格式,广义效应句没有规范格式,但可以采用违例格式,两主块广义效应句也存在违例格式。(关于规范格式和违例格式见2.1.1节)

广义作用和广义效应的概念来源于作用效应链(pp29)。在作用效应链的六个环节(作用-过程-转移-效应-关系-状态)中,作用和效应是两极,六个环节二分为广义作用和广义效应,作用、转移和关系属于广义作用,过程、效应和状态属于广义效应。相应地,根据作用效应链划分的六大句类可以二分为广义作用句和广义效应句。判断句有两个子类,一是一般判断句,二是基本判断句(详见第九章),分别属于广义作用句和广义效应句。

广义作用句广义效应句的首要区别就是上述语句格式上的不同,即是否具有规范格式。57个基本句类的广义作用和广义效应之分就是根据这一区别来确定的,在附录一的基本句类表示式中,每个基本句类前的编号就表明了它是广义作用句还是广义效应句:1到32是广义作用句,39到57是广义效应句,33到38是两可句类。所谓两可句类是指介于广义作用句和广义效应句之间的句类。

广义作用句至少有两个广义对象语义块,一是广义作用的发出者,二是广义作用的承受者,而广义效应句可以只有一个广义对象语义块,那就是广义效应的体现者,所以广义作用句的主块数大于等于3,广义效应句的主块数大于等于2。

汉语三主块和四主块广义作用句常用的规范格式是:

三主块广义作用句:

!11J=JK1+^JK2+E

!12J=JK2+^JK1+E

例如,

XJ=A+X+B 反动派暗杀了许多革命志士。

!11XJ=A+^B+X 反动派把许多革命志士暗杀了。

!12XJ=B+^A+X 许多革命志士被反动派暗杀了。

X10J=X1B+X10+XBC 小张负责联系客户。

!12X10J=XBC+^X1B+X10 联系客户由小张负责。

X20J=X2B+X20+XBC 张三很反感李四的做法。

!11X20J=X2B+^XBC+X20 张三对李四的做法很反感。

四主块广义作用句句:

!113J=JK1+^JK2+E+JK3

!114J=JK1+^JK3+E+JK2

!133J=JK3+^JK1+E+JK2

!116J=JK1+^JK3+^JK2+E

例如,

T2J=TA+T2+TB+T2C 张先生送给李小姐一束鲜花。

!113T2J=TA+^TB+T2+T2C 张先生给李小姐送了一束鲜花。

!114T2J=TA+^T2C+T2+TB 张先生把鲜花送给了李小姐。

!133T2J=T2C+^TA+T2+TB 那束鲜花让张先生送给李小姐了。

!116T2J=TA+^T2C+^TB+T2 张先生把那束鲜花给李小姐送去了。

“把”字句和“被”字句是汉语中最典型的规范格式,“把”字句和“被”字句一定是广义作用句,广义效应句一定不能用“把”字句或“被”字句。

广义作用句具有规范格式,这是就概念层面而言的,在词汇和语句层面,并非每一个广义作用句都具有规范格式,例如基本作用句XJ具有!11和!12两种规范格式,但由“攻打”形成的基本作用句就不能采用规范格式。

广义作用句和广义效应句之间能否用规范格式的区别在西语中也有相应的表现:广义作用句可采用被动式,而广义效应句不能。

两主块句的基本格式是!0J=JK1+E,它只有一种非基本格式,就是违例格式!2J=E+JK1,这种格式在汉语中十分常见,例如:

在这样的条件下,必然会出现山体滑坡现象。

将会形成三国鼎立的局面。

增加了10%的产量,却节省了15%的电能。

又停电了。

塌了两间房子。

跑了和尚跑不了庙。

 

02 语义块构成表示式只包含要素,

广义对象语义块要素的复合构成形式是 B(A)+C=>>BC(AC)

特征语义块要素的复合构成形式是 Ek=EQ+E+EH

语义块由要素部分和说明部分构成,要素部分是必有成分,是句类的函数,说明部分是可有成分,与句类之间没有函数关系,因此,在句类表示式中,语义块的表示式只表达其要素部分的构成成分,这就是“语义块构成表示式只包含要素”的含义。

广义对象语义块要素的复合构成是指要素中既有对象又有内容,这里的对象包含A和B。复合构成的JK以BC或AC表示,如一般反应句和主动反应句中的XBC、被动反应句中的XAC、基本效应句中的YBC等。在句类表示式中,如果一个JK以BC或AC表示,则表明它一定含内容C,或称之为显含C,这样的JK中常常出现句蜕,句蜕中的特征语义块(El)就是内容C的具体体现。这是一项宝贵的预期知识,在句类分析过程中,遇到BC或AC语义块,则优先进行句蜕处理即可。

表示式中只有A或B的JK是不显含C的,这意味着它们也可能含C,只是这个C不是必然存在的。

特征语义块要素Ek的复合构成已在2.1.2.1.2.3节详细阐述过了。

 

02a 每一个要素都可以有自己的说明成分Ωu,汉语的Ωu“一定”位于相应的要素之前,例外情况只有三种。

Ω是语义块要素部分的统称,Ωu是语义块说明部分的统称。

每一个要素都可以有自己的说明成分Ωu,那么如果一个语义块中有两个要素,它们可以分别带有自己的说明成分,例如:

城市居民的人均收入大大提高了。

这是个基本效应句Y01J=YBC+Y,其YBC包含两个要素,一是对象YB(居民),二是内容YC(收入),它们各有自己的说明成分“城市”和“人均”。

汉语的Ωu“一定”位于相应的要素之前,其三种例外情况是:

(1)Ek的修饰成分,只能出现在句尾,而且必须以“得”标记,例如:

近年来,中国经济发展得很快

张三的水平比李四高得多

大妈现在的身体好得很哪。

我的腿痛得厉害

中国队另一名选手乔娅今天发挥得也较出色

作品把围观者的神情刻画得惟妙惟肖

俄中军事技术合作进行得卓有成效

(2)特征语义块的下装HE和hv,已在2.1.2.1.2.2节详细阐释过了,这里只给出几个例句:

HE:他打了一整天高尔夫球。

他把儿子臭骂了一顿

那天的天气冷了。

hv:华东野战军吃掉了敌人的一个师。

我们得把对方的嚣张气焰压下去

大寨村的环境一天天好起来了。

3JK的数量说明成分,一定位于句尾,例如:

云南警方查获海洛因50多公斤

去年一年,我们厂共节约资金100万元

02b Ωu具有三种基本类型:同行型 句蜕型 通用型

同行型Ωu是指与要素有同行关联的说明成分。同行是HNC概念符号体系中表述概念关联的一个重要概念(pp32),是指“同一”概念节点的不同五元组表现。同行有狭义与广义之分,狭义同行是指概念节点相同的同行,例如“生活”和“幸福”都属于概念节点50a9,只是五元组不同,前者是gv,后者是u;广义同行是指概念节点之间具有交式关联的同行,例如“坚决”和“支持”,前者属于概念节点720(精神状态),后者属于43(关系的支持与反对),这两个概念节点之间有交式关联,所以“坚决”和“支持”是广义同行的。

要素的同行概念做Ωu可以说是天然的搭配,下面是一些例子:

那里的苗族同胞过着幸福的生活。

中国将一如既往地坚决支持巴勒斯坦人民的正义事业。

这将为深入对话奠定坚实的基础。

这给津巴布韦的农业造成沉重打击。

我本来就已经产生了厌倦情绪。

30年前,妇女运动蓬勃发展。

句蜕型Ωu是指由句蜕充当的说明成分,例如:

中国想建立世界多极化体制。

新条约将成为中国和俄罗斯加强关系的基础。

津巴布韦正面临政治暴乱和经济混乱的双重灾难。

米洛舍维奇是一个遭到军事袭击的国家的元首。

他们成功地争取到更多照顾子女的时间。

他们相信渴求人才的用人单位会主动找上门来。

穆加贝早在1997年作出的向战争老兵支付大笔养老金的决定使政府预算出现巨额赤字。

通用型Ωu是指同行型和句蜕型以外的说明成分,例如:

江泽民和普京还将着重讨论中俄经贸合作问题。

新条约将正式确认领土问题已经得到解决。

应该在世界法庭上审理这个案件。

在过去半个世纪里发生过许多可怕的大屠杀悲剧。

这位24的年轻人毫不犹豫地抛弃了这份枯燥乏味的工作。

美国部署国家导弹防御系统问题将是俄中两国首脑会谈的主要议题。

从上面的例句可以看出,同一个要素可以有两种类型的Ωu,比如最后一句,其要素“议题”的Ωu是“俄中两国首脑会谈”和“主要”,前者是句蜕型的,后者是通用型的。

 

 

03 汉语广义对象语义块核心要素一定位于相应构成的最后,英语反之。

语义块核心是要素中不可缺少的部分。

 

 

04 现代汉语的辅语义块一定在特征语义块之前。

辅语义块一定在特征语义块之前,这是现代汉语的一个很独特的现象,西语不是这样,古汉语也不是这样,如“躬耕于南阳”、“受命于危难之间”,都是辅语义块在特征语义块之后,为什么到了现代汉语,辅语义块就只在特征语义块之前了呢?很值得探究,但这不是本文要研究的内容。

由现代汉语的这一特点,可以得出两个重要的推论:

 

04a 在一个语串中,如果动词之后出现了辅语义块,表明该语串存在句蜕或块扩现象。

语串的定义是:书面语中由断句符号分隔出来的语言片断,断句符号包括句号、问号、叹号、逗号、分号和冒号。语串的一部分称为语段

这是一个简单的推理:辅语义块不能位于特征语义块之后,动词后出现了辅语义块,表明该辅块后存在一个特征语义块,这样该语串中就有两个特征语义块,所以必然存在句蜕或块扩。在这种情况下,辅块前的那个动词可能是全局E,也可能是局部E,例如:

许多国家谴责北约在南斯拉夫挑起一场战争。

北方少数民族大举入侵中原的事件在中国历史上发生过很多次。

第一个句子中,辅块前的动词“谴责”是全局E,第二个句子中,辅块前的动词“入侵”是局部E。

上面的陈述中忽略了一种可能,现在必须加以补充:由于存在无特征语义块的句类(详见通则06),因此,动词后那个辅块的后面可能并没有特征语义块,也就没有动词,但这并不影响该语串存在句蜕或块扩的推论,而且辅块前的那个动词同样可能是全局E,也可能是局部E。例如:

他认为1997以后香港的经济会更好。

香港跟大陆之间的合作关系将来一定会越来越密切的。

04b 如果动词后出现了带辅块标记的语段,且该语段位于语串的末尾,那么该标记为hv,该语段为广义对象语义块。

也就是说,动词后形式上像辅块的成分,其实应该是主块,它前面的标记也就应该是动词的后缀hv,而不是辅块标记了。例如:

张先生毕业清华大学计算机系。

我把你的书放书架上了。

上句是个素描句P11J=PB+P11+PC,其中的“于”是“毕业”的hv,“清华大学计算机系”是广义对象语义块PC,而不是辅块。下句是物转移句的规范格式!114T2J=TA+^T2C+T2+TB,其中的“在”是“放”的hv,“书架上”是广义对象语义块TB,而不是辅块。

把例句中的“于”、“在”看作hv,而不是后面语义块的标志符,这可能很不符合语言分析的习惯,但这是“现代汉语的辅块一定在特征语义块前”的必然推论,也是HNC语句表述模式的需要,而且是有利于语句的理解处理的。

 

 

05 汉语要素句蜕的主体一定位于相应构成的最后,并在主体前加“的”。

汉语要素句蜕的格式是把句子的一个语义块作中心语,另外的语义块作修饰语,修饰语和中心语之间一定有“的”,如下式所示。

<EJ> = (EJ-Kn)+“的”+Kn

要素句蜕的主体就是指其中的中心语部分Kn。要素句蜕的主体一定在最后,这是与汉语Ωu“一定”在相应要素之前的构成特点相一致的。要素句蜕的主体前一定加“的”,这是汉语句蜕规范化的表现,是汉语语句理解处理的有利之处,西语则无此便利。西语的要素句蜕是主体在前,其余在后,中间加关系代词,但关系代词常常省略,这就给理解处理造成了困难,因为省略了关系代词以后,主体和后面语义块之间的边界就不容易确定了。例如:(句中在相应位置补出了省略的关系代词)

This is the hardest fight (that) I’ve ever had in my life.

(这是我有生以来被打得最狠的一架。)

I have some advantages (that) they don’t have.

(我有他们所没有的优势。)

None of the cars (that) I saw was damaged.

(我看到的车子无一受损。)

要素句蜕中的句子可以是基本格式,也可以是非基本格式,例如:

基本格式

这需要<中美两国的密切合作> <R3J>

<亚洲的下一次经济崩溃>可能会由<日元的暴跌>所引发。 <YJ>

我们必须与北京携手对付<日本危机所带来的巨大影响> <P21J>

米洛舍维奇为<自己所做的一切>感到骄傲。 <XJ>

他和大约100<他亲自挑选的同事>重操旧业。 <XJ>

非基本格式

总序中的一段话也许最能代表<他对这套书的理解> <!11D01J>

大气和太阳光中存在<对人体有害的紫外线> <!20XJ>

<粘污在表面上的物质>可以变成气体。 <!24S021J>

<常驻东京的柯蒂斯><少数几个曾预见到1997年亚洲金融危机的经济学家>之一。 <!24S0J> <!24D01J>

 

 

06 存在无特征语义块句类,因此一个句子或句蜕、块扩中可以没有动词。

只有四个无特征语义块句类,其中最常见和最重要的是简明状态句S04J(详见8.3节),另外三个是简明势态句、集内比较判断句和参照比较判断句(详见9.2节)。