1998年06月12日

我国计算机理解语言研究走出新路
黄曾阳创立的“概念层次网络”理论正在产品化

记者 何东平

  本报北京6月11日讯 中国科学院声学研究所研究员黄曾阳,八年
迄今创立“概念层次网络”(HNC)理论,在计算机理解自然语言上获
新突破。目前,由中科院声学所、中国人民大学对外语言文化学院、
北京语言文化大学语言信息处理研究所、中科院软件中心组成的攻关
组正在为“概念层次网络”理论产品化和产业化紧张工作。全国人大
常委会副委员长、著名语言学家许嘉璐日前考察这一攻关组后说:这
是落实科教兴国战略的一件实事。

  攻关组成员、中国人民大学对外语言文化学院教授林杏光介绍说,
用计算机理解人类的自然语言,这是几十年来未能攻克的世界性重大
科学难题。迄今为止,许多语言信息处理系统或产品多是基于统计的,
例如,输入计算机时反复出现“完成”与“任务”相连,计算机便能
反应出“完成任务”为正确搭配。然而,这并非建立在对语言理解的
基础上。15年前,日本花费巨资搞了一个第五代计算机(又称智能计
算机)计划,其中一个重要目标就是使计算机能理解人类语言,结果
未获成功。美国微软公司1998年计划投入26亿美元,用于开发自然语
言理解等软件技术。黄曾阳总结了国外在这方面希图一步到位的教训,
提出计算机理解语言的新标准——“消解模糊”。林杏光解释说,语
音流具有五重模糊,即发音模糊、音词转换模糊、词的多义模糊、语
义块构成的分合模糊、指代冗缺模糊。书面语主要存在后三重模糊。
黄曾阳创立了语汇层面联想脉络和语句层面联想脉络,其实质是用语
义分析代替传统的句法分析。举例说,将一个句子输入该理论的系统,
它能识别谁是句子的核心,并对核心进行语义分类和句类分析,最后
达到计算机理解语句的目的。将没有标声调的拼音流输入,计算机能
进行智能音字转换。这一高新技术,将使机器翻译、电话翻译、人机
对话、智能检索、自动文摘等语言处理的各个领域获得实质性的重大
进展,为我国创新语言信息产业带来了曙光。

  黄曾阳已发表论文《HNC理论概要》。中国中文信息学会理事长、
中国工程院资深院士陈力为教授为之写下评语:“机器翻译搞了几十
年,但至今未能达到可供实际应用的水平,其主要原因正是自然语言
理解没有获得根本性的突破。任何科学上的突破都需要非常规的思维
即扩散性的求异思维。黄曾阳先生创立的面向自然语言理解的理论框
架HNC理论,在语义表达上有自己的特色,在语义处理上走了一条新路。鉴于汉语语法研究尚有诸多困惑,因此,HNC理论所走的以语义表达为基础的新路子对突破汉语理解问题尤其有实际意义。”

  


http://www.gmw.com.cn/0_gm/1998/06/19980612/GB/17721^GM1-1211.htm