一、句类分析难点11

1.11 省略难点(11号难点,标记:J*7)

省略属于自然语言多重(语音5重、书面语3重)模糊中的所谓冗缺指代模糊的“缺”。这个“缺”是缺漏和省略的统称。语音识别时的吞音失误,书写、誊写、排版以及其他原因造成的遗漏,都属于缺漏,不是省略。缺漏是语言应有信息不合理的“缺”,或来于主观因素的失误,或来于客观因素的丢失。省略是语言应有信息合理的“缺”,是语言艺术性的需要。两者的共性表现是“缺”。省略的定义已在1.3节中说明,哪里使用的术语是缺省,即这里的省略,也就是说,“冗缺指代”里的“缺”有缺漏与缺省之分。这些话我早就应该交代的,到今天才在这里写下来,深感歉咎。

缺漏处理应暂时有所不为。当然,如果开发HNC校对系统,它是首当其冲的两急所之一,另一急所是消冗处理。

1.3节说明了省略的两种基本类型,给出了两类主块省略和两类语义块构成省略的理论概括,这一理论概括是考察和处理省略难点的基本依据。显然,如果没有句类表示式,是不可能给出这一概括的。

在书面语中,省略的内容通常应在上下文里有所交代。根据句类表示式的引导信息,利用句类检验的手段,省略处理理应不存在根本障碍。然而,语言的艺术性表现(调皮现象)也会使得省略处理出现十分复杂的情况:被省略的语义块或其一部分不与上下文中特定的语义块、短语或词语完全对应。这一不完全对应有两种基本类型,一是对应具有不确定性,例如1.4节所分析的最后一个例句。二是有所扩展,即作者在上下文中的交代不够完整。

因此,省略处理难点实质上就是深层情景知识-潜在性存在揭示的难点。

省略处理的基本依据是句类表示式,如果同时存在多句类代码难点,那么,究竟是否存在省略或省略了什么都处于待选状态。这时,省略处理的困难就同多句类代码难点交织在一起了。

指代从某种意义上也是一种特定形式的省略,上面关于省略难点的阐述同样适用于指代。所以,指代与省略处理应采用同一核心软件模块。