《汉语理解处理中的动态词研究》


我是书文的热心翻阅者或浏览者,逐步形成了一种积习。即使是需要我写序的新书,也是如此对待。但这一次,这个积习终于被打破了。那是由于翻阅到唐兴全博士新著《汉语理解处理中的动态词研究》中的一段话,拷贝如下。

动态词的辨识是汉语理解处理中的必需模块。动态词在汉语中占有很高的比例,一个信息处理用的词表,不管规模多大,都不可能穷尽所有的词,因此,动态词是语句分析的重大障碍。动态词研究将帮助提高句类分析系统的效率和准确性,对于句处理阶段的中文信息处理有重要意义。动态词的组合识别服务于语义块感知和句类假设、语义块构成分析等句类分析的主要环节,对最终解决汉语的计算机理解问题具有主要意义。动态词组合模式具有较强能产性和规则性,动态词的识别与语义认定应该建立在对动态词组合模式详尽描写的基础上。如果我们搞清楚了能产的组合模式,就可以根据这些模式来处理在言语中随时可能出现的由这些模式所造成的动态词的语义。因此,应根据动态词组合模式的不同特点,制定不同的识别策略。(见该书第三章p45)

这段话很有一点康德先生所提倡的理性法官气势,它推动着我往下查看其落实情况。于是,我细读了该书的第四章。结论是:作者对汉语动态词组合模式的3大类划分(“以概念类别为纲”、“以概念组合结构为纲”和“特殊组合模式”)是高瞻远瞩的,第一大类的4小类划分是明智的;第二大类的8小类划分是精巧的;第三大类的3小类划分是周到的。大部分论述符合康德先生要求于理性法官的透彻性和齐备性标准。这使我非常惊异,如同在茫茫大漠里遇到了一片绿洲。

于是,我接着细读了该书的第五章,一路惊喜。因为 10多年来出现了关于语言本体的熙攘浪潮,但是,那语言本体之“本”究竟何在?那熙攘浪潮对这个根本问题实质上是采取回避态度的。现在,一本敢于正视这一根本问题的著作终于出现了,这是语言信息处理领域的一件大事!所以,我原本打算向作者写点热烈祝贺的话。

但是,最后我还是决定引而不发。为什么?因为仅仅立足于语义思考,毕竟还不能达到一流语言理性法官的高度。动态词识别的终极解决方案必须立足于语境分析,即语言理解基因与动态记忆的激活。词语的语义分析是语言理解处理的核心环节么?人类语言脑的语言理解处理过程存在独立的词语处理和句处理阶段么?作者是完全有潜力完成这一重大思考的,从而在第五章与第三章之间建立起更好的呼应。

然而,即使是当前的版本,它已经是同类著作中最优秀的了,对此,我没有任何疑义。

                                               

                                                           黄曾阳

                                                          2011/06/09

                                                         于北京阑珊庐