52个论题之28:论句蜕处理

 

    如果说块扩基本上是语义块物理表示式的显式特征,那么,可以说句蜕基本上是语义块表示式的隐式特征。对块扩,可以从概念层面和词汇层面获得足够的信息,但句蜕不能。因此,句蜕处理似乎要比块扩处理困难得多。然而,这只是一个假象,实际情况并非如此,本文就着重阐述这一点。

    块扩、句蜕和复合句类都面临着一个共同的问题,就是在一个音串内出现了两个E团块,在论题2-2中把它们叫做v1和v2。块扩是用一个从句充当一个语义块;句蜕块也是用一个从句充当一个语义块,不过汉语常常表现为它所特有的句蜕形式;复合句是两个E共用一个甚至两个语义块。

    复合句已在论题17中讨论过了,上一个论题讨论了块扩,这里首先应该回答的一个基本问题是,软件如何在这三者之间进行选择?

    任何选择都要寻找突破口,在思考方式上你一定要有意识地避免循环搜索方式对你的约束。计算机擅长循环搜索,因此自然语言理解处理的软件设计者似乎要特别注意“扬短避长”而不是“扬长避短”。这是理解处理的一条重要策略原则。突破口的寻找是这一策略的要点。

    上述“三选一”的突破口在哪里?在块扩,因为块扩拥有最完备的信息。庄老师提出过,块扩与复合句类有时不容易区分,我还不了解庄老师所说的细节,但可以肯定的是,如果存在块扩与复合句类的两可现象,一定与句类有关。我坚信绝大多数可块扩句类不会与复合句类混淆。

    在块扩现象不难先行确定的前提下,上述“三选一”就简化成了“二选一”问题。即句蜕与复合的辨认(也许庄老师指的是块扩与句蜕两者与复合句类的模糊?病后记忆力更差了,常因此而烦躁不堪)。句蜕有两种基本形式,一是句蜕块表现为一个完整的句子,这种句蜕形式在西语用关系代词加以标志,比较容易辨认;二是取一个句子的某一块素或某一说明项作为句蜕块的中心,句子的其他部分变成句蜕块的说明成分,两者之间加“的”予以标志。这种句蜕块汉语比西语容易辨认,西语里这种类型的语义块往往是分离的,从而出现语义块构成模糊。那个常被引用的例子“I saw a girl with a telescope in the garden”就表现了西语的这一典型和普遍的语言模糊现象,而这一现象在汉语基本上不存在。

    汉语对第一类句蜕经常加以包装,这就同西语的方式很接近了。例如“一年来物价稳中有降的事实”、“HNC攻关组建设知识库的实践”、“克林顿与莱温斯基有染这件事”,这里的“的事实”、“的实践”、“这件事”都是包装,这里的“的”、“这”或“这件事”就相当于英语that,which的语法功能。所以,先应该抓住汉语有包装的第一类句蜕块。

    略有麻烦的是无包装的汉语句蜕块。如“打击贪污腐败现象要坚持不懈并且绝不能手软”、“坚持和平共处五项原则是我国政府外交政策的一贯方针”、“美国接连在广岛和长崎投掷了两颗原子弹和苏联红军进军东北迫使日本宣布无条件投降”。这里句蜕块都未包装,每个句子有两个甚至三个E团块,形式上显得很复杂。但是,你不难注意到:第一,这里的E1都不具有块扩特征;第二,这里的E2具有论题2所指出的各种特征,第一句的E2具有“九五之尊”,第二和第三句的E2“是”和“迫使”都是绝对的亮点。根据论题2-2提出的v1-v2处理准则以及基本判断句jD与作用效应句的句类知识,这里的E1语句仅充当句蜕块是一清如水的。

    当然,不像上面例句那样一清如水的情况肯定存在。我希望联合攻关组成员注意收集这样的句子,将来好写进《句类知识手册》。这里应该指出汉语一个非常宝贵的特色,就是汉语语义块的要素一定在最后。基于这一特色,当情况比较复杂时,你可以运用下述绝招:句蜕形式语句的E2句类经常通不过要素检验,因为它实际上是Eg而不是E2。但复合句类不存在这一情况,它的E2必须也必能在E1的要素中找到一个匹配者。总之,还是那句老生常谈,句类检验是辨认所有这一类模糊的法宝。

    第二类句蜕块有4种基本形式,我们先看4个例子,然后推而广之。

              HNC联合攻关组一年来取得的巨大研究成果

              一年来取得巨大研究成果的HNC联合攻关组

              HNC联合攻关组一年来巨大研究成果的取得

              一年来HNC联合攻关组(所取得的)研究成果的巨大

    这些例子是效应句Ya0的各种句蜕块,第一个例子以YC(JK2)为句蜕块的要素;第二个例子以YB(JK1)为要素;第三个例子以Ya0为要素;第四例子以YC的说明块素“巨大”为要素,比较特别,它就是上面所说的以“某一说明项作为句蜕块的中心”。上面的4个示例或4种句蜕类型反映了三主块句句蜕块的一般规律。这里比较难以辨认的是第二种类型。如何判断“巨大研究成果的HNC联合攻关组”不是“取得”的复合构成YC?这需要作一次句类要素检验。我不记得这那一个论题里已经谈过这个诀窍了,这里就重复一下吧。即分别对“的”的前邻词语和“的”块下界进行E-JK2检验,如果前邻词语通过了检验,而下界通不过,则表明是第二类句蜕块;反之,它是第一类句蜕块。如果两者都能通过,当前采用蒙混过关方式,按第一类句蜕块处理。如果两者都通不过,表明有伪词存在,当前只好请求交互。

 

                                                   黄曾阳

                                                    1998年9月25日