有关“科学”和“语言”的畅想

—— 浅谈HNC的学科定位

 

鲁 川

教育部 语言文字应用研究所, 北京朝内南小街, 100010

luch111@163.com

 

  按照科学分类体系,HNC是一门交叉学科。

  为什么HNC必然是自然科学跟人文社会科学的交叉学科呢

  “科学” 是人类对世界进行研究所形成的,反映世界的各种客观规律的分科的知识体系。

  科学的分类,或者说对科学的命名,通常是以其研究对象为依据的。如自然科学是研究自然界各种物质和现象的科学;社会科学是研究各种社会现象的科学。这种命名方法是把研究对象看作是“共时”(synchronic) 的,即各种研究对象都是共同出现在某一时期的。

  在地球上,有的科学研究对象出现得早,有的研究对象出现得晚。如“生物”就比“非生物” 出现得晚。所以,对科学的命名方法也可以是“历时”( diachronic ) 的,即按研究对象在地球上出现的早晚来为科学命名。

  1.1 “历时”的角度,即从地球进化史的角度来看地球上先出现的都是没有生命的物质,所以自然科学的第一个大的学部就是“物质科学”(Physical Sciences)

  物质科学是研究自然界各种“无生命物质”的结构、性质、变化及其运动规律的自然科学。包括:物理学、化学、天文学、地矿学、新材料工程、新能源工程等等。

  1.2 经过长期的进化,地球上开始出现了“有生命物”,所以自然科学的第二个大的学部就是“生命科学”(Life Sciences)

  生命科学是研究自然界各种“有生命物”的结构、功能、发生、发育、繁殖及遗传规律的自然科学。包括:动物学、植物学、生理学、医疗学、遗传学、基因工程等等。

  2、经过更长期的进化,地球上出现了作为“智慧动物”的人类,人类从来就是群居并伴有各种人文社会现象的,于是就有了“人文社会科学”(Arts & Social Sciences)。

  人文社会科学是研究各种人文和社会现象的科学。包括:历史学、法学、经济学、伦理学、美学、文艺学、哲学等等。

  3、人类既然作为智慧动物,与人类“智慧”相关的各种现象,如对于世界的认识即知识的获取、对于知识的表示 (representation) 即知识的编码 (encoding)、对于知识的运用即知识的处理等,也必然成为科学研究的对象,于是就出现了既具有自然科学性质又具有人文社会科学性质的“智慧科学”(Intelligence  Sciences)

  智慧科学是研究“具有智慧的人类”以及协助人类进行智慧活动的“智慧机器”的各种智慧现象的交叉科学。包括:认知科学、心理学、决策学、语言学、人工智能、知识工程等等。

  在这个科学分类体系中,HNC当然是“智慧科学”的一个典型的学科分支。

  查《现代汉语词典》关于“科学”的释义是:反映自然、社会、思维等的客观规律的分科的知识体系

  如果把“思维”看作是“智慧的无声的内在活动”,把“语言”看作是“智慧的有声的外在形式”,那么上述《现代汉语词典》给“科学”下的定义中关于“自然、社会、思维”三分的说法就证实了“自然科学、社会科学、智慧科学”三分的合理性。而且给“科学”下的这个定义也回答了本文开头提出的问题:“为什么HNC必然是自然科学跟人文社会科学的交叉学科?”

  “语言”(language)是人类对认知世界的知识进行编码的复杂的符号系统。

  人类通过感觉器官(眼睛、耳朵等)和知觉器官(大脑)对客观世界的信息进行接收和加工,在大脑中形成了认知世界,经过“去伪存真、去劣存优”的优化处理和“分门别类、有条不紊”的系统化处理就形成了“知识”(knowledge) 。这些知识是既看不见又听不到的,所以必须对于知识进行“编码”,即把无形的知识“成”以有形物质媒体承载并能储存和传播的、且为特定人类群体所理解的“代 ¾¾ 符号系统”。

  语言分为两种:

  1、自然语言(natural language) 是在某个人类群体中经过漫长的岁月按照“约定俗成”原则逐步积累、逐步演化而形成的有声的极其复杂的符号系统。自然语言的特点是:先有语言事实,然后才由语言学家从语言现象中归纳出语言的结构规则所以,自然语言具有任意性、歧义性、模糊性、缺省性。世界上的汉语、英语、俄语、藏语、蒙古语、维吾尔语都是自然语言。

  2、人工语言(artificial language) 是某一位杰出的学者在人类的自然语言的启发下按照“逻辑推理”原则精心设计逐步实现而形成的一种既完全符合理想又严格遵守规则的简明的符号系统。人工语言的特点是:先有了语言的结构规则,然后才有了语言事实。所以人工语言具有关联性、单义性、精确性、完整性

  人工语言的分类有两种视角:一种视角为“该人工语言的服务对象”,另一种视角为“是否模仿自然语言的词汇”。综合两种视角,人工语言可以分为下列四类:

  2.1 人跟人交流服务且模仿自然语言词汇人工语言,如:波兰医生柴门霍夫在1887年设计的世界语(Esperanto) 等。

  2.2 为地球人跟宇宙人交流服务但不模仿自然语言只用数字符号人工语言,如荷兰的学者弗登塞尔的“宇宙语言(cosmic language )。他在1960年发表了《宇宙语言:宇宙交际语言的设计》,在1974年发表了《宇宙语言》的专著。

  2.3 人跟计算机交流服务且模仿自然语言词汇的的人工语言,如各种程序设计语言。

  2.4 计算机理解自然语言服务但不模仿自然语言只用抽象符号人工语言,如HNC

  人们把在历史发展过程中可以作为标志的大事比喻为“里程碑”。

  “物质科学”的研究成果中有许多里程碑,其中有一座里程碑是门捷列夫的元素周期表

  “生命科学”的研究成果中也有许多里程碑,其中有一座里程碑是本世纪初刚完成的人类基因图谱测序

  “智慧科学”的研究方兴未艾,也将会有许多的里程碑。我们由衷地希望HNC能成为智慧科学的诸多里程碑中的一座,它将是竖立在中国土地上纪念中国学者的丰碑。

  任何的里程碑都不是自封的。只有公正的历史老人才有资格宣布哪项科学研究成果堪称为当之无愧的里程碑。

  我们为跟HNC的创立者同是一个时代的中国人而高兴,更为能够参与HNC的点滴工作而自豪。

再过几个世纪,让我们的后代聆听历史老人的宣布:二十一世纪前期完成的HNC是“智慧科学”发展过程中由中国学者作出贡献的一座里程碑

 


作者简介:

鲁川,男,河南开封人,1961年毕业于哈尔滨工业大学计算机系,1987年被选为中国中文信息学会计算语言学专业委员会主任。现为教育部语言文字应用研究所研究员,中国应用语言学会理事。研究的领域为人工智能、自然语言理解、机器翻译、对外汉语教学等。专著有《汉语语法的意合网络》,主编了《动词大词典(人机两用)》,在《中国语言学报》、《世界汉语教学》、《语言科学》上发表了多篇论文。