二、难点处理谋略

本章讨论难点的处理谋略,而不是方案。这是对引言中所述预定安排的修正,这个修正非常重要,否则就是越俎代庖的重大失误。方案只能也必须由文字文本组和语音文本组的技术总体负责人去完成,自然语言理解处理方案必然涉及软件的具体技术细节,而谋略可以不涉及,我只能在谋略方略方面贡献一点力量。当然,不是每一种技术方案都需要谋略策划,但自然语言理解处理方案是绝对需要的。从某种意义上甚至可以说,高水平的谋略策划是理解处理方案成功的基本保证。

自然语言处理特别需要一部关于处理谋略的高水平专著的指导,可惜目前还没有。《专著》的文献索引中之所以引录了毛泽东和孙武的名著,除了他们是形成HNC思路的源泉这一因素之外,也是为了引起读者对谋略重要性的认识。

本章试图对自然语言理解处理的已有谋略进行比较系统的探讨。

首先,我们引录一段毛泽东先生在《中国革命战争的战略问题》一文中的一段重要论述,该文是毛泽东先生为清算“左”倾机会主义在第二次国内革命战争时期犯下的严重军事谋略错误而写的。

我们现在是从事战争,我们的战争是革命战争,我们的革命战争是在中国这个半殖民地的半封建的国度里进行的。因此,我们不但要研究一般战争的规律,还要研究特殊的革命战争的规律,还要研究更加特殊的中国革命战争的规律。

仿效引文,可以提出下面的论断:

我们现在是从事自然语言处理研究,我们的处理是理解处理,我们的理解处理是汉语理解处理。因此,我们不但要研究一般自然语言处理的规律,还要研究理解处理的特殊规律,还要研究更加特殊的汉语理解处理的规律。

读者或许会认为,这是一个毫无新意的仿效论断,是众所周知的十分浅显的道理。然而有趣的是,专家们往往在自身领域的浅显方面大犯错误,而在深奥方面反而错误较少。所以,不能轻视事情的浅显方面,这里所说的浅显方面实质上就是人类智能活动的谋略方面,包括战略和战术两个侧面。

本章将讨论下列题目:

关于浅显中的深奥

关于自然语言理解处理谋略的方法论

关于自然语言难点的本体论