HNC(概念层次网络)语言理解技术及其应用》

晋耀红 

科学出版社

20064


 

后记

       在本书即将成书之际,作者心情非常复杂,其中有激动,有忐忑,也有压力,更多的是对未来的憧憬。

       学习和研究HNC整整10年了。回想起这10年的时光,其中不乏探索的快乐,但也伴随着开拓的艰辛。在这期间,句类分析系统经历了3次重构,系统几万行的代码也经过3次重写,每次重构可以说都是一次涅磐。第一次设计系统前,由于前面有好几个硕士、博士的尝试都不尽如人意,而自己又是初出茅庐,当时的压力可想而知。记得当时吃饭、睡觉、走路,无时不在反复玩索“句类”、“感知”、“假设”等词语,当时的痴迷,直到现在还令人神往。第二次重构时,面临着国家九五科技攻关项目的鉴定,记得鉴定前的一个礼拜,每天都是挑灯夜战到深夜,当时的投入,至今仍令人难忘。第三次重构,是在HNC研究院刚刚成立的大好形势下进行的。当时作者正在攻读在职博士,而研究院的应用开发又刚刚启动,句类分析的重构面临着技术的深入和开发的规范双重要求。所幸的是,研究院慢慢培养了一批队伍,承担起了平台移植、接口规范等工程性的工作,自己才抽出时间完成了博士论文。当时的分身乏术,现在也就一笑了之了。10年后的今天,句类分析系统已经基本稳定,对汉语的一些难点也有了一定的处理能力,更重要的是,它已经成功应用到产品开发中去,作者也在本书中对这些工作有了一个初步的总结,一想到此,作者就抑制不住自己的激动。

       激动之余,也不免有些忐忑不安。本书所设计的算法,虽然已经有了一些成功应用,但是,这些算法是否完全体现了HNC理论的精髓,是否符合客观的语言规律,是否具有可持续发展的能力,这些都还需要在实践中进一步检验。尊师黄曾阳先生,1998年把他的专著《HNC理论》送给作者时,在扉页上寄语“回首三关成大悟,探求两变待芳霏”[1],直到今天,反思10年来的工作,自己离先生“成大悟”的要求还有多远?答案在黄先生心中,也在作者自己心中。

       虽然经过几年的发展,句类分析技术已经初具规模,但离交互引擎的总体目标还相去甚远,对自然语言理解20项难点的综合治理才刚刚起步,对独特的汉语句子的理解还有颇多问题。这些,都使得作者在完成本书的同时,感到千斤重担在肩,丝毫不能松懈。有压力才有动力,这些压力将促使作者,在本书的基础上,继续探索,再攀高峰。

       本书中涉及的句类分析技术和语境单元萃取技术,仅仅是交互引擎的前哨战,交互引擎的制高点是语境生成和机器翻译。前者关系到信息的再抽象,将直接推动信息抽取、信息摘要,特别是网络信息的有效利用向智能化、知识化迈进。后者是通向古老的、神奇的巴比伦塔的必经之路,是实现知识全球一体化的关键技术。交互引擎的实现是HNC语言理解技术的基本定位,上述两个制高点是当前信息领域面临的最大的挑战。本书的内容,为迎接这一挑战打下了坚实的基础。在这个基础上,我们有理由放任自己的想像力,憧憬着交互引擎将在HNC中长期规划的15年后得到实现。

       激动、忐忑已成为过去,压力、憧憬将转换为动力,作者愿以饱满的热情迎接新的挑战,愿以自己的青春为交互引擎的实现而奋斗。

       “航向已经确定,征途刚刚开始”,愿以此书与所有的朋友共勉。

 



[1] 这里,“三关”指的是句类分析3部曲,“两变”指的是机器翻译的过渡处理,已经更新为6项过渡处理。当时,句类分析第一次架构刚刚完成,正值黄先生专著出版,故先生寄语于此。