一、句类分析难点综述

句类分析难点分全局性和局部性两大类。

全局性难点又分两大子类:一是与句类的假设和检验有关的难点,二是与句间信息利用有关的难点。编号为1~13。

局部性难点也有两大子类:一是与“体词”有关的难点,二是与动词有关的难点。编号为14~20。这里对体词打了引号,因为包括汉语里与动词兼类的体词。

第一类全局性难点可分为两个基本侧面,一是全局E块 (Eg) 或其团块(即连见动词构成的Eg)的多句类代码难点,二是局部E块 (El) 对全局E块的判定形成干扰的难点,简称El干扰。这两类难点在“说明”中的编号是1号和2号难点。一般说来,El干扰并不难判定,但针对El的局部句类分析却很不简单,主要是块扩和句蜕现象,这些难点的编号分别是6~10。

第二类全局性难点也有两个基本侧面:相应于有无句间信息标记可供利用两种情况,所谓句间信息标记就是HNC理论所定义的语言逻辑概念l9、la、lb三类概念。这3类概念相应于传统语言学定义的指示代词、部分副词和部分连词。HNC理论对所谓虚词的传统语言学分类方式,采取“分化瓦解区别对待”的策略,另搞一套分类体系,形成HNC三大超级语义网络之一的语言逻辑概念,是HNC理论建立第一个理论模式的重大举措之一,对于以语义块感知为切入点的句类分析技术的实现是关键性的。

句间信息标记的有无与句间信息利用的难点不存在简单的对应关系,有不意味着易,无也不意味着难。我们将把句间信息利用的难点统称隐知识揭示,按其难易程度分为浅层和深层两类。浅层隐知识揭示定义为冗缺指代模糊的消解,深层隐知识揭示定义为:句间潜在性因果关系的揭示,句类潜在性转换的揭示。后者是指语句表示方式(即句类选用)的多样性变化。

浅层与深层隐知识揭示难点分别编号为3号和4号,其中两种重要的特殊情况分别命名为复杂省略和复杂因果句,并另行编号为11和12。

下面按编号次序分别对各项全局性难点作详尽说明,在说明难点的同时也适当介绍相应的亮点。战略上藐视困难的关键就在于在看到难点的同时也看到亮点,并对亮点有真知灼见,同样,战术上重视困难的关键就在于在看到亮点的同时也看到难点,并对难点有真知灼见,否则就是盲目的藐视或重视,是幼稚和无知的表现。真知灼见往往是言简意赅的表述,但读者难以理解,本文试图对1号难点以另一种方式进行阐述,因而行文将十分臃肿,但效果也许将适得其反。

1.1 全局特征语义块Eg的多句类代码难点

1.2 El干扰难点

1.3 浅层隐知识揭示难点

1.4 深层隐知识揭示难点

1.5 句类转换难点

1.6 主辅变换难点

1.7 复杂JK构成难点

1.8 JK分离难点

1.9 句蜕难点

1.10 块扩难点

1.11 省略难点

1.12 因果句难点

1.13 难点的综合表现

1.14 体词多义模糊难点

1.15 两可双字词或多字词难点

1.16 E块省略句类的辨认难点

1.17 EK复合构成难点

1.18 双字新词难点

1.19 多字新词难点

1.20 分词难点

 

拖延了几个月之久的局部难点说明总算是勉强完稿了,不仅丝毫没有了却一桩心愿的轻松,反而有欠债更多的重负。不论环境如何发展与变化,我是决心在适当的时间到适当的地方再一次“闭关”了。

至于本文计划中的第四章-“杂谈”,在“闭关”前能完成多少,确实心中无底,只能听其自然了。