HNC语言知识处理研究院简介


创新序曲

HNCHierarchical Network of Concepts的缩写,是中文“概念层次网络”的英文对译,它是中科院声学所黄曾旸研究员创立的面向整个自然语言理解处理的理论框架。这个理论框架用来指导计算机弄懂人的语言。

人类很早就开始研究语言现象。计算机问世以后,除了使用它进行繁复的数值计算外,另一个很重要的方面就是用它处理语言。

计算机是一个勤劳笨拙的工具。它能够进行庞大、繁复的数据计算,是由于在数的世界里有非常精确和规律的运算法则,只要人用计算机的语言将这些法则告诉它,计算机就可以不厌其烦地进行运算。人类的语言,纷繁复杂,有人说它是人类思维的外壳。也就是说,能够充分理解、自由运用人类的语言,就意味着拥有人类的智慧。让计算机部分模拟人类的智慧,让计算机懂得人的语言,是一个极其尖端的科学研究领域。这里最需要创新。

西方是计算机的诞生地,也最早提出了用计算机处理人类语言的想法。随着时间的推移,产生过许多相关的理论和技术,但他们都没有取得实质性的突破。

HNC理论立足于模拟人脑的语言感知过程,明确指出自然语言理解的本质是概念联想脉络激活、扩展、浓缩、转换与存储的全过程运作。激活运作的要点是语句的理解;扩展与浓缩运作的要点是段落与篇章的理解,转换与存储的要点是记忆与学习。从这一观点出发,可以发现尽管语言的外在表现丰富多彩,用“无限”形容不为过,但在语言的深层――概念层面来看,它具有很好的脉络性――联想脉络,对此脉络的操纵是有限的。换言之,HNC理论要做的事是,像我们从现实世界抽象得到数一样,从语言中得到联想脉络;就象计算机使用运算法则对数值进行加工处理一样,通过对联想脉络的操纵,完成对自然语言的理解处理。当然HNC理论绝不仅仅是一个自然语言理解观这样简单,它需要在这个理解观指导下建立起概念联想脉络,确立对这些脉络的操作法则。这些是HNC理论工作者已经和正在作的工作,创新的思路、创新的精神已经在这里得到了充分的体现。

大正研究院

HNC理论诞生之日起,就开始了技术实现的进程。经过多年的积累,已经形成了自然语言处理技术――HNC句类分析技术。为了加快HNC语言知识处理技术的工程化进程,让其尽早形成喜闻乐见的软件产品,中国科学院声学研究所和深圳麦尼实业发展有限公司,合作建立大正语言知识处理研究院,共同推进HNC语言知识处理技术的产业化进程,为各种软件产品的开发提供实用适用的核心。

理念

知识聚集资本、用技术组织生产要素。

宗旨

以人为本,建立HNC语言知识处理创新技术的孵化器。

信念

用计算机解放人类的脑力劳动。

价值观

献身职业、成就事业,不断学习、积极创新。

我们的技术

HNC是“九五”国家科技攻关项目、国家“九七三”重点基础研究发展规划项目和中国科学院知识创新工程项目。HNC句类分析技术是我们的独享技术,该技术已经申请了发明专利。

HNC句类分析技术突破了现有的自然语言的知识表述和处理模式,直接进入自然语言的语义深层进行处理,特别适合于非形态变化的汉语的理解与处理,在汉语语句理解处理方面达到国际领先水平。

 

核心技术――HNC语言知识处理技术
应用技术――模糊消解 知识处理 机器翻译
产品技术――语音识别的纠错处理,文语转换文本处理;音字转换技术,文字文本校对技术……;文字文本分类,文本知识挖掘,摘要生成,全文检索,知识处理基地构建技术,网用自然语言问答技术,……;多语种的双向机器翻译技术……。

我们的目标

HNC语言知识处理技术为核心,在应用层面、产品层面开发形成系列HNC品牌的、自然语言知识处理软件技术。