《语言概念空间的基本定理和数学物理表示式》

序言



    2003年9月 中科院声学所和北京大正语言知识处理研究院联合举办了第二届HNC与语言学研讨会,我在会上作了“在反思中前进,在碰撞中成长”的发言,会后将发言稿整理成4万8千字符的同名长文。在会议论文集行将出版的时候,论文集主编之一杜燕玲副研究员建议我将该文和我近年应邀所写的另外4篇论文合成一本小册子一同出版。我非常感谢并欣然接受杜主编的这一建议,并将这本小册子定名为“语言概念空间的基本定理和数学物理表示式”。
    在接受建议并给小册子定名的同时 我心里也十分忐忑不安。因为这一次在一定程度上似乎又在重蹈《HNC理论》出版过程的覆辙。但《HNC理论》有《HNC理论导论》的弥补,相信这本小册子将来也会有相应的弥补。因此 我就决心再次献丑了。
    所有的自然语言空间(据说 当今世界上还存在6,000种之多)对应着同一语言概念空间,这是HNC理论的第一基本假设。语言空间各有自己的个性,语言研究固然需要面向这些个性,但更需要面向语言空间的共性。更具体地说 对那些寓于个性之中的共性的研究才是语言本体的研究。一个常见的认识误区是:以为语言本体的研究就是思维的研究,这两者是不能画上等号的,语言本体只是思维的一部分,语言是“思维的外壳”这一著名论断实际上应加上“之一”二字,因为 无比丰富的数学符号、图形符号、艺术符号都是思维的外壳。因此 必须承认 语言概念空间只是概念空间的子空间之一,此外 至少还有形象、情感、艺术、科学等概念空间。建立所有概念空间的统一理论是哲学的任务,这一任务的艰巨性甚至大于物理学的统一场论。认知科学的探索者已经体会到这一探索的艰辛,于是主要采取狐狸式探索,因为他们认为 刺猬式探索在此必然是徒劳无功。但是 如果把研究目标局限于语言概念空间,是否会出现峰回路转的新局面?
    这本小册子希望对这个基本问题给出HNC的初步答案。
    这个初步答案集中体现在“反思与碰撞”一文所阐释的“概念无限而概念基元有限、语句无限而语句概念类型(句类)有限、语境无限而语境单元有限”这一基本论点里,或简称“3限说”。整个HNC理论体系的构架是以“3限说”为基础而展开的。概念基元的有限性可称为HNC第一定理,句类的有限性可称为HNC第二定理,语境单元的有限性可称为HNC第三定理。该文并未使用定理一词,而是把它们作为3项需要进行求证的假设来对待。
    按成文的时间顺序来说 最早的“语句理解”一文是对第二定理的论述,同时提出了翻译引擎基本原理的研究方向;第二篇“发展与展望”是对第一和第二定理的系统论述,第三篇“语义概念体系”侧重于第一定理的论述,第四篇“语言学基础”触及到3个定理的全部核心科学问题,最后一篇“反思与碰撞”则侧重第一和第三定理的论述,并对HNC理论体系最近6年的发展做了一个全面的概括。因此 编者将此文列为这本小册子的首篇是合理的。
    “反思与碰撞”一文给出了语言概念空间的4组表示式——(HNC1)、(HNC2)、(HNC3)和(HNC4),其中的(HNC1)是概念基元空间之根概念的数学表示式,(HNC2)是句类空间的数学表示式,(HNC3)是语境单元空间的数学表示式,(HNC4)是语境空间的数学表示式。但应该说明:后两个表示式实际上也是相应语言概念空间的物理表示式。至于句类空间的全部物理表示式请参看苗传江博士所著的《HNC导论》。这些物理表示式还需要扩展它的符号功能,这项工作的进展将在《HNC探索与实践》网络季刊里即时报道。
    以上列4组表示式为依托 “反思与碰撞”一文提出了交互引擎的概念,描述了实现交互引擎的3项理论工程、4项技术工程和1项基础工程。交互引擎研究与开发在后工业时代占有特殊地位,它的实现已经不再是一个不切实际的梦想了。这是一个重要信息,也是这本小册子希望向读者传达的基本信息。
    最后 作者要向海洋出版社表示最深切的谢意和最钦佩的敬意。谢意而最是因为主事者对我这个已脱离海洋科学战线15年的老朋友依然给予特殊关照与支持,敬意而最是因为主事者同意这本小册子采用作者建议的逗号改革方案。现代汉语逗号的语言功能太多,但众多功能中的小句标记与非小句标记之区分对语句理解处理至为关键,如果逗号仅用于小句标记,而把其他标记功能一律以空格替换,则对于汉语理解处理将产生功德无量的效果。空格是汉字的潜在财富,汉字改革的一些先行者曾经意识到这一点,并建议用于分词标记。这一建议也许由于汉语分词本身就存在众多难题与争议而未获实行,但空格用于逗号改革则简单易行,作者已实际使用了多年,并在HNC内部读物中流行。这一次 海洋出版社接受作者的请求,打破常规,开历史之先河,在正式出版物中第一个试用这一方案,这一举措使作者感受到主事者的战略眼光,无限钦佩之情在多年备受冷落之后不禁油然而生。


黄曾阳      
2004年3月1日