HNC(概念层次网络)语言理解技术及其应用》

序 二



在苗传江博士的《(HNC概念层次网络)理论导论》出版的前夕,晋耀红博士完成了HNC(概念层次网络)语言理解技术及其应用》的撰写,翻阅着这近400页的长篇专著,我不禁想起“双剑合璧,所向无敌”的武林佳话。

HNC理论与技术的双剑合璧之战已经走过了8年的艰苦历程,苗著(将简称《理论)和晋著(将简称《技术》)分别是这8年探索历程的理论和技术总结,但是,它的意义又远远超出了通常意义下的总结,因为,它是HNC探索进入了催生交互引擎这一新阶段的标志。

双剑合璧的武林佳话不过是神话,HNC的双剑合璧之战(即交互引擎的研究与开发)曾被人们视为神话,我也同样深感疑虑。因为交互引擎的实现虽然在理论上不过是三组HNC方程式的求解,但这是知识方程的求解,而不是微分方程或代数方程的求解。因此,它将面临一系列前所未有的巨大挑战,HNC能够应对这些挑战么?《理论和《技术》是对这一重大科学问题的第一份答卷。

把交互引擎的研究与开发变成一个知识方程的求解问题是先验理性思维的一项新尝试,康德先生曾应用这一思维方式开创了形而上学的新局面。HNC追随康德先生的思路,试图在大脑思维奥秘的局部领域,即自然语言理解领域(这一领域大约只占大脑思维全部奥秘的1/10),打开一个新局面。开启这一新局面的钥匙只能是康德先生所定义的验前知识的获取与应用,而绝不可能存在什么别的捷径。诚然,计算机强大的计算能力可能形成自己的经验理性,这种经验有可能在抽取自然语言文本蕴涵的某些知识方面获得应用,但绝对无益于计算机自然语言理解能力的提高,如果对此存在幻想,那无异于指望把全世界的盲人动员起来,就可以追捕到容貌已知的逃犯。

HNC认为,自然语言理解的全部验前知识构成语言概念空间,这一空间的数学结构可以用四组知识方程式来描述。这四组方程规定了交互引擎必须具备的三级理解提升过程。第一级提升是语句的理解,HNC的专业术语叫句类分析,第二级提升是句群的理解,HNC的专业术语叫语境单元萃取,第三级提升是篇章的理解,HNC的专业术语叫语境生成。这三级提升对应着自然语言的三级理解过程,HNC把第一级理解过程归结为对一组方程式的求解:语句理解对应着句类表示式(HNC2)的求解,句群理解对应着语境单元表示式(HNC3)的求解,篇章理解对应着语境框架表示式(HNC4)的求解。

显然,句类表示式(HNC2)的求解是自然语言理解的第一道难关,《理论全面阐释了突破这一难关的验前知识准备(HNC术语叫句类知识),而技术》的第一部分则全面阐释了突破这一难关的验前知识运用。这里需要强调指出两点:第一,实际语言的语句理解仅依靠验前知识是不够的,还需要运用大量的验后知识;第二,语句的理解经常不可能在语句的范围内孤立完成,还必须借助于句群甚至篇章的语境知识。技术》的第二部分对此作了比较系统的分析。

至于语境单元表示式(HNC3)和语境框架表示式(HNC4)的求解,技术》从应用的角度给出了一个素描,它构成《技术》的第三部分。

如果说技术》第一部分的阐释遵循了验前知识第一的思路,那么,第二和第三部分的阐释则没有继续遵循这一思路了,这不是作者的过失或疏忽,而是由于句群和篇章理解所依托的验前知识(HNC术语叫领域句类知识)还处在设计阶段,相应知识库的建设还需要一段时间。

但是,在同一本专著中采取不同思路的写作方式毕竟值得商议,这里引用唐宋八大家之一的曾子固(巩)先生在《赠黎安二生序》里的一段话来表达我的感想,曾先生的原文如下:

“夫世之迂阔,孰有甚于予乎?知信乎古,而不知合乎世;知志乎道,而不知同乎俗,此予所以困于今而不自知也。……然则若予之于生将何言哉。谓予之迂为善,则其患若此。谓为不善,则有以合乎世,必违乎古;有以同乎俗,必离乎道矣。生其无急于解里人之惑,则于是焉必能择而取之。”

就交互引擎的探索来说,我深信,只要坚持验前知识第一的思路,它就一定能够达到胜利的彼岸,我希望10年之后,技术》将以全新的面目再次出版,那个时候,也许我们能够正式宣告,将给网络世界带来理性光辉的交互引擎终于在中华大地诞生了。

但是坚持验前知识第一的思路需要智慧和坚韧,下面引用康德先生的两段论述与作者共勉,也作为本序言的结束语。

“如果经过细致准备之后,经常又重新起头,而接近目标时,又须立即停止下来;如果常常迫不得已要走回头路而走向另一条新的前进路线;如果各个参加工作的人不能一致采取前进的共同计划,那么我们就可深信,工作是远远没有踏进科学的稳妥途径,而不过是一种在暗中胡乱摸索而已。在这种情况下,如果我们能够找到理性所能安稳进行的途径,我们对于理性就是作出一种贡献,即今这样做时,其结果是会把原来没有经过反思而在我们的初始计划中所采取的许多东西作为无效果而予以放弃。”

“理性有不可否认的自身矛盾,而这种矛盾在理性的独断过程中也是不可避免的。此种矛盾早已败坏了形而上学体系的权威。我们要通过一种完全与前此所用的绝不相同的方法来最后使人类理性不可或缺的一门科学繁荣兴盛起来——这门科学的枝叶是可以砍掉的,但它的根干是不能毁灭的——如果在这种努力中,我们想不为内部的困难和外部的反对所阻止,我们就得更加坚定。”

                                                                                                           黄曾阳

                                                                                                                                                       20057月