HNC理论全书 第三卷

 

卷首语

本卷是本《全书》的最后一卷,HNC理论的主旨将在本卷阐释。笔者很希望 撰写方式能有所改变,以减少给读者带来的不便,但惯性的力量或许将使这一希望化为泡影。

为什么要搞这么一个HNC理论?为了揭密语言脑,为了开发语超(语言超人)。

语超将是一个纯物理系统,不涉及化学和生命科学,仅仅是对人类语言脑[*01]的计算机模拟。但语超将具有比人类语言脑远为强大的功能,因为它可以轻而易举地做到“一目万千行,过目不忘”,是传统中华文明意义下才子(叫“一目十行,过目不忘”)的超级形态,不是智力、体力或机械意义上的超人,而是一种语言超人,简称语超。

语超可以有各种各样的类型,最简单的语超将是未来人类的得力助手。当然 语超必然是一把双刃剑,既可以成为人类的朋友,也可能成为人类的敌人。这是一个与本卷有关的重大话题,但将完全回避;大脑奥秘的探索应该以语言脑为突破口,而不是像当下流行的大脑研究那样 对“大脑的5大构成”不细心加以区分或无视这一区分,这也是一个与本卷有关的重大话题,也将基本回避。本卷仅致力于回答这样一个科学话题:人类语言脑的纯物理模拟可以实现么?

HNC理论把这个科学话题分解成下列4项:

概念无限而概念基元有限;

语句无限而句类有限;

语境无限而语境单元有限;

显记忆无限而隐记忆有限。

这是HNC理论的4项基本命题。如果这4项命题是正确或基本正确的,那语超就有了坚实的理论基础,它的实现就不应该存在不可逾越的技术障碍。语超就是图灵机,而图灵机的诞生将不仅是科学的大事,也是哲学和神学的大事,关于意识与存在之间的无穷论争至少可以因此而告别一个阶段了。

4项命题也直接关系到大脑之谜的探索,因为四者的初级技术转化产品将类似于一个婴儿型的语言超人(将简称婴超,以前曾用名微超),而婴超本身不单是语超的过渡或雏形产品,也是大脑探索的有力模拟工具,曾冠以语言脑“电子白老鼠”的美名。

HNC理论探索的历程中 《理论》阶段仅涉及前两3项命题,那时 前两项是明确的,但第三项是懵懂的;《定理》阶段才扩展到全部4项命题,第三项趋于明朗,但第四项依然比较懵懂,趋于明朗乃《定理》以后的事。这些命题初期仅名之假设,后期则名之公理。假设与公理有天壤之别,但请不要太叫劲,先看作是揭密语言脑的需要吧。

4项话题将构成本卷前4编的名称:

——第一编 论概念基元

——第二编 论句类

——第三编 论语境单元

——第四编 论记忆

后续4编的名称依次是:

——第五编 论机器翻译

——第六编 婴超论

——第七编 语超论

——第八编 展望未来

这就是说 本卷共计八编,前五编“论”字在前,接着两编“论”字在后,为什么要作这样的区分?第六编会作交代。

第一卷曾采用“编-篇-章-节-小节”的5级结构,第二卷无“篇”,采用“编-章-节-小节”的4级结构,本卷也无“篇”,主要采用“编-章-节-小节”的结构,但也有采用“编-章-节”之简化结构和“编-章-节-小节-分节”之扩展结构的情况。

本卷的许多要点 前两卷有不同程度的预说。基于以防万一的考虑 有些预说接近正式论述,这使得本卷的相应论述沦为一种呼应性的东西。对于这种情况 将尽可能以注释的方式予以说明。

 

                          HNC理论全书

第三卷 第一编 论概念基元

 

编首语

本编分6章,各章编号、汉语命名和相关HNC符号列表如下:

编号        汉语命名                相关HNC符号

第一章      概念基元总论            CP

第二章      五元组                  (v,g,u,z,r)

第三章      概念树                  CT

第四章      概念延伸结构表示式      (CT:(OD//ED)|;)

第五章      概念关联式              (CPm,L,CPn)

第六章      语言理解基因            LUG

 

其中 大写英语字母HNC符号的对应词语如下:

 HNC符号   英语               汉语

CP  Concept Primitive                    概念基元

    CT    Concept Tree             概念树

    OD    Ontology Description                 本体论描述

        ED    Epistemology Description             认识论描述

        ,L,   ,Logic link,                         逻辑联接

        LUG   Language Understanding Gene          语言理解基因

 

这些HNC符号前两卷都使用过,直接阅读本卷的读者可能很不习惯,这没有关系,本卷下文都有交代。本《全书》篇幅过于庞大,笔者不仅希望每一卷可供读者独立阅读,甚至希望每一编甚至每一章都能提供这种便利。这是前两卷搞了许多插写和预写的基本缘由,但希望归希望,结果很可能是事与愿违。

 

注释

[*01] 语言脑是人类大脑进化历程的第四次演变,是人类正式诞生的基本标志。此前的三次

演变分别是图象脑、情感脑和艺术脑的相继诞生,此后的一次演变是科技脑的诞生。这些演变的基础是生理脑。图象脑、情感脑、艺术脑、语言脑和科技脑将简称“5脑”,也叫“大脑的5大构成”。在大脑里 它们各自占有自己的区块么?答案似乎是否定的,否则 脑科学早就应该发现了。但是 尚未发现并不等于否定,因为脑科学的研究可以说是“生不逢时”,一方面不得不跟随心理学的深厚形而下传统,另一方面又得不到形而上思考的滋润,后者的社会背景前文有过多次论述。

当然 图象脑、情感脑、艺术脑、语言脑和科技脑的各自区块绝不可能像地球村的5大洲那样边界分明,“5脑”之间必然呈现出比“犬牙交错”更为复杂的景象,这是大脑迷宫无与伦比的独特性。这一独特性对“5脑”各自独立存在的态势必将产生巨大的掩盖或混淆作用,但不能成为否定其存在性的证据。

    关于图象脑、情感脑、艺术脑、语言脑和科技脑乃相继诞生并各自独立的证据已经太多了,有志于此的读者完全有条件写出一本精彩的科普读物。这里要告诉这位未来作者 HNC理论仅关注其中的语言脑。考虑到语言脑与情感脑的交织性最为密切 本《全书》在第一类精神生活的论述中(见第一卷第二编)对情感现象给予了一定关注。

 

 

第三卷 第一编 第一章 概念基元总论

 

引言

本章的地位等同于前两卷的第零章,是关于概念基元共相的论述,随后各章是其殊相的论述。这些话本应该放在卷首语里叙说,向读者通告本卷的一项特殊约定:各编都不设置第零章,但第一章可能拥有前两卷第零章的地位。这毕竟属于技术性细节,所以就后移到这里了。

前两卷的章对应于概念林,节对应于概念树,这种对应性本卷在形式上不复存在,但实质上依然存在。这里的“实质上”是指HNC特别关注的所谓“体说、面说、线说和点说”[*00],编或篇大体对应于体说;章大体对应于面说;节大体对应于线说;小节大体对应于点说。但是 “体--线-点”是相对的,不是绝对的,四者之间既“你中有我”,又“我中有你”。汉语“面面俱到”的成语不仅是体说的通俗解释,也是后续三说的通俗解释,“面面”者 齐备也;“俱到”者 透彻也。请把这两对“者 也”当作是“面面俱到”的真解吧。

本《全书》卷、篇、编、章、节、小节的设置与论述都依据上述“面面俱到”原则,本卷亦不例外,本章的下列6节就是实践该原则的产物。

1节:概念基元有限性的形而上思考(语言概念空间基本景象的描述)

2节:概念基元的抽象与具体两分

3节:抽象概念基元的范畴三分

4节:基元、基本和逻辑概念的“6、2、4”分

5节:广义作用效应链的“二生三四”

6节:语境基元

 

 

第三卷 第一编 第一章 1 概念基元有限性的形而上思考

 

    本节标题后面的括号里有一个不寻常的短语——语言概念空间基本景象的描述,这个短语可简化成“语言概念空间的基本景象”,还可进一步简化成“彼山基本景象”。这些短语都更适合作本卷开篇首节的标题,但考虑再三 还是选用了这么一个不合时宜的标题。这不是为了保持撰写风格的一致性,而是为了凸显科学探索的要害所在。对于揭秘语言脑这一极为特殊的探索 这一点乃是攸关成败的第一大事,因为 如果没有形而上思考的足够功力,你是很难看清彼山基本景象的。当然 彼山景象本身的描述非常重要,前文已经花费了不少文字,后文会继续这么做,本《全书》以着重描述彼山景象为己任,也有成就一部彼山专著的梦想,但毕竟孤掌难鸣,笔者将仅以披荆斩棘为满足。描述此山景象的专著早已是浩如烟海了,通俗读物也不乏精彩之作,如果将来能出现兼述两山景象的专著或通俗读物,那都是一件功德无量的事。

“概念无限而概念基元有限”是HNC探索起步时的一个基本假定。该假定的提出受到两件事的启发或激励,一是黑格尔的名言:哲学的开端就是一个假定;二是汉字的“减而不增”现象,《理论》里对此有符合世界知识阐释标准的论述[*01]。

基于“概念无限而概念基元有限”假设而得到的第一批探索成果既包括本章后续3节所描述的内容;也包括本编第二和第三章的内容,那是1990年代初期的事。当时 一些HNC的朋友曾把这一初步成果比做元素周期表的发现。这个比喻一直使笔者深感不安,因为“概念无限”或许有点类似于物质结构和形态的无限,但“概念基元”不能等同于元素,而“概念基元有限性”更不能等同于元素周期表。

“概念基元”是什么?它是所谓的语义基元或概念节点么?这是本节必须回答的第一个问题。

“概念基元”如何定义?“概念基元”与“基元概念”是什么关系?这是本节必须回答的第二个问题。

“概念基元有限”是假设还是公理?公理之说的依据何在?这是本节必须回答的第三个问题。

下文以3个小节进行论述,每小节的标号方式与前两卷相同,以达到《全书》的统一。3小节的汉语名称依次是:概念基元不是语义基元或概念节点、概念和概念基元都需要采取灵巧式定义、概念基元有限性是语言概念空间(彼山)的第一公理。

 

1.1.1 概念基元不是语义基元或概念节点

语义是当下中国的热门词语,国家级科技项目都高举着语义的大旗。这个景象非常奇特,笔者也不明白其究竟。但有一点是清楚的,多年来主宰着计算语言学的语法派(理性主义)和语料库派(经验主义)都遇到了巨大的危机,传统的词法和句法分析已经难以有所作为了,基于语料库的各种统计算法(语料库语言学)已开始显露出“黔驴”的本相。双方都要寻求出路,不约而同地都求救于语义学,以为语义是一根靠得住的救命稻草。

在英语词典里 并没有语义这个词语,只有语义学这个词语,《现汉》也如法炮制。《现代汉语规范词典》(《现范》)反其道而行之,收录了“语义”而未收录“语义学”,因为《现范》原则上不收录带后缀“学”的三字词。幸亏有这条原则,否则就有点难办了,因为《现范》对“语义”的解释十分宽泛,大大超出了《现汉》对“语义学”的解释范围。

《现范》对“语义”的解释[*02]需要大力依靠“意义”这个通用词语,还要依靠“词汇”、“句子”、“语法”、“语用”、“语境”等专业词语以及其他一系列通用词语(如“概念”、“交际”、“适应”等)。《现范》对“语义”的解释在形式和内容两方面似乎都十分到位,但语言脑对“语义”的理解依靠这样的解释么?这里的“依靠”既有“能不能”的问题,又有“需要不需要”的问题。不追问这两个问题是形而下思维或“一竿子”思维的习惯或表现,追问下去才是形而上思维或灵巧思维的习惯或表现,这将在下一小节细说。

下面回到本小节的主题:概念基元不是语义基元或概念节点。先说“概念基元是什么”,然后再说为什么“概念基元不是语义基元或概念节点”。

概念基元是指456株概念树所对应的各级延伸概念,不包括概念树本身,更不包括居其上位的概念林(群)和概念范畴。延伸概念这个术语提出较晚,笔者在使用这个术语之初也没有特意强调一下它的极端重要性,这是HNC探索历程中最为遗憾的一件事。基于一种弥补最大遗憾的心情,这里特意写下对应的英语符号:Extended Concept,简记为EC。

各级延伸概念的总和是有限的,本《全书》的前两卷已充分揭示了这一点。所谓“概念基元的有限性”就是指“各级延伸概念总和的有限性”。理解了这一点 才算是真正理解了HNC理论的精髓。

但真正理解这一点并非易事,这既需要向上思考,把握“概念树-概念林-概念范畴”的有限性;又需要向下思考,把握延伸级别(纵向延伸)的有限性和同级延伸数量(横向延伸)的有限性。上行思考和下行思考都要力行齐备性和透彻性的原则(简称透齐原则,前两卷经常使用这个简称),这确实是“一竿子”思维习惯难以适应的。

这里的“上行思考”和“下行思考”是以概念树为参照来说明的,如果以概念范畴为参照 则上述“上行思考”也变成了“下行思考”,HNC之“概念范畴-概念林-概念树”的最终确定是上行与下行思考多番交织的结果,“1200个汉字”虽然曾是此项交织思考的基本依托,但该思考的主心骨还是康德先生所强调的理性法官[*03],这就是说 上行与下行思考要在不断改变参照层级的过程中交织地进行,而关键是:要善于中间切入先上后下。一味“上而不下”者叫空想家,专注“下而不上”者叫专家,善于“中间切入先上后下”者才是思想家。上行思考的通俗名称叫仰望星空,下行思考的通俗名称叫俯瞰大地。语言的“星空”叫做语言概念空间,简称彼山,描述彼山景象的东西叫原则或公理;语言的“大地”叫做自然语言空间,简称此山,描述此山景象的东西叫规则或定理。乔姆斯基先生虽然自视甚高,但并不明白这个关于原则与规则的区分依据或区别法则。“一竿子”思维的基本特征是:既不仰望,更不俯瞰,而是随波逐流。一个世纪以来 语言和大脑的探索是否处于随波逐流的可悲状态呢?是提出这个问题的时候了。

当然 随波逐流是一股巨大的惯性力量,是文明主体之现代化历程的心理引擎之一,也是一把双刃剑,其积极意义的一面不能抹杀。但是 许多重大的科学探索活动要力求避免随波逐流的消极面,而这项特定的“力避”非常困难,在HNC探索的《理论》阶段 这种消极影响可谓历历在目,最典型的印迹就是“语义网络”、“语义块”、“语义距离”等术语的提出或使用。其中 “语义块”这一术语最令笔者痛心疾首,因为那个“义”字不仅是多余的,而且为害极大。

语形、语义、语用之“三语”说[*04]是符号学对20世纪人文社会学的一项重要贡献,但“三语”说乃是貌似体说而实为线说的典型学说,并未发展成为适用于彼山景象描述的指导理论。语形、语义、语用不过是仅供分析与归纳之用的三条线而已,不能构成符合“综合与分析+演绎与归纳”要求的三维度思考空间,因而也必然不能胜任彼山景象的描述。语言学界曾应用“三语”说于此山景象的描述,但收效不大。表面上似乎形成了语形学、语义学和语用学之间的分工与合作,实际上是造成了一幅独特的“推卸责任”景象,把困难(矛盾)逐级上交,语形学解决不了的问题上交给语义学,语义学解决不了的问题再上交给语用学。其结果是:出现了许多有趣的责任纷争,这主要发生在语义学与语用学之间。但是 自然语言处理的基本责任究竟是什么?该项处理所面对的劲敌(根本问题或战略性问题)和流寇(枝节问题或战术性问题)[*05]有哪些?纷争的参与者们并不明确,甚至都没有认真思考过。

语形学实际上是语法学的老地盘,千年老店,品牌价值无与伦比;语义学也有许多不俗的成绩,语用学更是曾风光无限,促成了20世纪哲学研究的著名语用学转向。但品牌价值、不俗成绩和无限风光几乎丝毫无助于机器翻译遭遇的半世纪尴尬[*06]。这是一个严酷的现实,但被一些传统的光环所掩盖了。当然 不能说学界有人在刻意隐瞒什么,但实际上在起着一种掩盖作用,中国计算语言学界的表现尤为突出,林杏光先生的重庆遭遇[*aaa]就是一个非常值得反思的事件或证据。

这里应该明确告知读者 HNC探索就是从对这一严酷现实的反思开始起步的,其理论目标就是试图建立一个符合“语形、语义、语用”体说要求的理论体系。当时对语义学的认识还是比较清醒的,知道它绝对没有能力独立承担起降服劲敌和扫荡流寇的重任,可是为什么《理论》竟然还是提出了“语义块”的术语呢?现在回想起来 未免感到不可理喻,因为当时已非常清楚:“语义块”不仅是语义的基元,也是语形和语用的基元,是三者的综合基元。这个“义”字添加的失误造成了巨大的贻害,现在不理解此话的读者将来会逐步明白的。

但读者现在就应该理解 为什么说“概念基元不是语义基元”了,因为在HNC的词典里 只有概念基元,没有语义基元;只有语块,没有语义块。子曰:“必也正名乎!”(《论语》:《子路》篇)还是照孔夫子的意见办吧。

概念节点这个术语是怎么流行起来的 笔者也不太明白。这个术语的弊端在于它不区分概念树及其上端的概念和处于概念树之下的延伸概念,后者才是“概念无限而概念基元有限”这一命题里的概念基元。这就是说 概念节点是一个过于笼统的概念,不用为佳。

“概念无限而概念基元有限”的命题是HNC理论的根基,本《全书》的前两卷就是对该命题的论证。论证的基本思路也可以从用上行思考和下行思考这两个方面来表述,上行思考的表述是:概念基元的有限性立足概念树的有限性;概念树的有限性立足于概念林的有限性,概念林的有限性立足于概念范畴的有限性。那么 语言脑的概念范畴是否有限呢?HNC的答案是:当然。请把这答案当作是一项公理来对待吧!下行思考的表述是:延伸概念的纵横结构都是有限的,纵向延伸的边界触及专家知识,横向延伸的边界触及生理脑和大脑之另4项构成(图象脑、情感脑、艺术脑和科技脑)的相关知识。诚然 这两大边界也许是一个巨大的模糊地带,那就让它们继续存在吧,不进入或适度进入该模糊地带就是HNC的基本对策。如果说 语言脑概念范畴的有限性是概念基元有限性这一论断的必要性保证,那么 不进入或适度进入的基本对策就成了该论断的充分性保证。

 

1.1.2 概念和概念基元都需要采取灵巧式定义

上一小节最后说到的基本对策不过是灵巧思维的一次简单应用,本小节要说明的内容就不同了,它不是灵巧思维的简单应用,而是简单应用。

与灵巧思维对应的东西叫一竿子思维,一竿子思维的典型样板就是关于语言的定义,国内教科书里的表述如下:语言以语音(?)为物质外壳,由词汇语法两部分构成的符号系统(??),是人类最重要的交际工具。人们利用它进行思维(???),交流思想(?),组织社会生产,开展社会斗争,承载信息,传承文明。它有口语和书面语两种形式。是一特殊的社会现象。

上面 对此段论述加了不同个数的“?”,所指文字以仿宋字体标示。被标示的词汇或短语共计4个,“?”越多 问题越大,最多的标了3个问号,相应的问题依次陈述如下:

——问题1:“语言以语音为物质外壳”

怎么可以只提语音而撇开文字呢?这也许适合于印欧语系,但绝不适合于汉语,汉语不可能拼音化,还需要为消灭汉字的主张保留退路么?

——问题2:“语言符号系统仅由词汇语法两部分构成”

词汇语法”不就是符号学的语形么?怎么可以把“三语”说的语义和语用这两个维度抛开不管,而死守着19世纪之前的语言学阵地(说法)呢?乔姆斯基先生不是早在1950年代就用一个著名的例句“Colourless green ideas sleep furiously”否定了“两部分构成”的说法么?

——问题3:“人们利用语言进行思维

这个说法给了三个问号——(???),因为 那个仅由“两部分构成”的符号系统怎么就可以用来“进行思维”?如此重大而奥秘的科学课题怎么可以这么轻飘飘地一笔带过去而成为一个论断?

——问题4:“交流思想”

这个说法似乎是天经地义,为什么也给了一个问号呢?因为 “交流”同后面的“组织、开展、承载、传承”一起 犯了一个“数典忘祖”或“舍本逐末”的错误,那“祖”和“本”是什么?是“担当”,语言的最大功绩是“担当”,它担当着文明三学(神学、哲学和科学)的表述,从而造就了人类和人类文明。怎能撇开“担当”,而一味强调“交流”?怎能撇开文字,而一味强调“语音”?这都是“一竿子”思维的典型呈现。

灵巧思维培育的第一步就是要善于提出问题,善于从表面或形式上似乎严谨无比的论断里找出问题,并对语言的面具性保持高度警惕;第二步就是要善于运用理性法官的智慧去考察和思考问题,并形成命题;第三步是对命题进行论证——证实或证伪;最后一步才是实践。可以撇开前面三步不管而直接去实践么?可以!人类的绝大多数活动都是这么干的,许多伟人也不例外。但语言和语言脑的研究不可以,基于此 笔者不看好美国和欧盟各自雄心勃勃的所谓21世纪大脑研究项目:“大脑逆向工程”(美国)和“蓝色大脑计划”(欧盟)。

上面对语言的教科书论述提出了4个问题,要害是问题3。针对它 需要提出新的命题。这个新命题不过是对原命题加上两个汉字,用“语言概念”替代“语言”,由此引出了自然语言空间和语言概念空间的一系列新概念和新课题,形成了关于此山景象和彼山景象的一系列新描述。这些新描述的精髓是:语言脑用于进行思维的绝不是自然语言空间所对应的此山符号体系,而是语言概念空间所对应的彼山符号体系。此山符号体系把概念之间的联想脉络与知识几乎“毁灭”殆尽,而彼山符号体系则将恢复该联想脉络与知识的本来面目。这里存在着两套符号体系,两套符号体系都存在于语言脑之中,此山符号体系大体相当于计算机的外设,而彼山符号体系则大体相当于计算机的核心。

千年老叟对此处变不惊,很冷静地笑着说:“娃子,你这算啥子嘛!我的语言就是语言概念的简称嘛!”

“娃子”哑然失笑,但老叟对“两套符号体系”采取置若罔闻的态度 “娃子”并不感到惊奇,因为彼山符号体系确实是语法老叟难以习惯的,逻辑仙翁也基本如此。

彼山符号体系是灵巧思维的产物,概念和概念基元都采取了灵巧式定义。

灵巧式定义是一个比较复杂的话题,所以 前两卷已作了多次预说。第一次预说是直接针对定义的,阐释了HNC所定义概念的确定性特征。其内容引述如下(参见“广义作用反应7101”概念树的[121-011]小节)

说到定义 哲学上有著名的循环论之争,这一争论的本质来于自然语言词语意义的不确定性,这就是语言哲学应运而生的学术背景。但是 HNC的概念树及其延伸概念的表示符号具有完全确定的意义,这是由符号本身所决定的,符号里的任何一位数字都没有任何意义的不确定性,或者说 其不确定性只包含在该数字串的最后一位或最后一组数字里,这就是数字化表示的无与伦比的(相对于任何其他的符号表示方式)优点,这一点是大家所熟知的

第二次预说阐释了词语意义的实质是:它在语言概念空间的定位,传统语言学未能提供此项定位的描述工具,HNC概念基元符号体系试图填补这一空缺。其内容引述如下(参见“情感基本表现7131”概念树的[121-31-0]分节):

基本情感7131的概念延伸表示式表明 其前两级延伸概念都不被赋予积极与消极的含义。当然 相应的词语并不遵守这一约定,这就是自然语言符号和HNC符号的本质差异,语言学的消歧与翻译、语言哲学的描述与解释、训诂学的笺疏与注解 都密切联系于词语意义在语言概念空间的定位,而过去缺乏一个定位标准或定位参照系,如今 HNC概念基元符号体系提供了这样的标准或参照系

第三次预说阐释了两套符号体系相互映射所对应的科学课题,引述如下(参见“常态意志7201”概念树之[122-01]节的结束语):

HNC符号意义的确定性和自然语言符号意义的模糊性实际上提出了符号转换学的两项特殊课题:模糊意义的确定性表示和确定意义的模糊性表示,前者是从语言空间到语言概念空间的符号变换,服务于语言理解,是交际引擎输入接口的基本操作;后者是从语言概念空间到语言空间的符号变换,服务于语言生成,是交际引擎输出接口的基本操作。但是 映射与反映射是相辅相成的,两者齐头并进并相互印证才是HNC词语知识库建设最佳方式,HNC团队一直未能正式这样做,这既是笔者的失误,也是笔者的无奈,因为概念延伸结构表示式的设计始终处于滞后状态

上列三点分别概述了HNC定义概念的基本原则、HNC符号体系(即语言概念空间的描述方式)的本质特征以及两套符号体系(自然语言的和HNC的)之间的主从关系,但都回避了或隐藏了一个基本问题,那就是灵巧思维的简单运用,下面就来予以具体说明。

在概念定义方面 这要以概念树为参照分开来说。HNC对概念树及其上位概念所采取的描述方式似乎与通常的分类学(例如生物学分类和图书分类)没有本质区别,但实质上存在着本质差异,主要表现在两个方面:一是概念范畴的灵巧性符号表示;二是概念林和概念树的灵巧性符号表示。

下面分别说明实施灵巧符号表示的具体措施,先以表的形式表示其要点。

 

           表:抽象概念3大范畴及其子范畴的表示符号

  类别        符号              汉语命名

  基元概念    (0,1,2,3,4,5)     主体基元概念(作用效应链)

(71,72,73,8)      第一类精神生活

a                 第二类劳动(专业活动)

(b,d)             第三类精神生活

q6                第一类劳动

(q7,q8)           第二类精神生活

基本概念     j

逻辑概念    jl                基本逻辑

l                 语法逻辑

f                 语习逻辑

s                 综合逻辑

 

此表的灵巧思维运用集中表现在以下4个方面:

1)基本概念和逻辑概念的范畴符号一律以字母表示,并对基本逻辑予以特殊照顾,采用了双字母,它既是汉语“基本”与“逻辑”两拼音符号首字母的复合,又是“基本概念j”与“逻辑l”的复合,该符号试图体现一种东西方文化的融合形态。

2)基元概念分别采用了无范畴标记和有范畴标记两种表示方式,前者对应于主体基元概念,后者对应于语境基元概念。这就是说 主体基元概念不带范畴符号,不过 曾以一种虔敬的心情使用过希腊字母ф,但最终放弃了,也许用佛学的语言来说更准确:最终被“涅槃了”。表中的(0,1,2,3,4,5)实际上是主体基元概念的概念林符号。

3)语境基元概念的范畴符号区分两种形态:纯数字形态和“字母”形态。前者对应于弱时代依赖性的语境基元概念,后者对应于强时代依赖性的语境基元概念。这里“字母”二字必须加引号,因为它可取数字“6//9//c//(~6)”,前3个数字表示该语境基元概念仅分别存在于“农业、工业和后工业”三个历史时代,“(~6)”表示工业时代才出现(即不存在于农业时代)的语境基元概念。直接使用字母“q”则仅表示其强时代依赖性。两类语境基元概念也曾以虔诚的心情分别使用过希腊字母ψ和λ,最后是:ψ也被涅槃了,λ则被q替换了。

4)在基元概念中 作为范畴标记符号的数字呈现出下列怪异现象:

——以数字7开始,以数字d结束,但中间“缺失”(跳过)了数字9和c。

——相连的(7,8)属于同一子范畴——第一类精神生活;但相连的(a,b)并不属于同一子范畴,而分别属于第二类劳动和第三类精神生活。

——数字7最为特殊,它要再捆绑一个数字才能构成一个完整的子范畴符号,它们分别是:

        71      “心理”

    72      意志

    73      行为

——主体基元概念和弱时代依赖性语境基元概念的首位数字连成“以0开始,以d结束,中间跳过(6,9,c)”的数字串,这个被跳过的(6,9,c)是一组特殊符号,如同军队里的特种部队,它可以前挂于主体基元概念,以提供一种简明的语境信息,标明该前挂概念之本能、理性与理念的三层级区分特性。这里的“本能、理性与理念”大体对应于康德的“感性、知性与理性”。

上面一股脑儿叙述了那么多范畴符号表示的约定,很对不起读者。干吗要搞这么多招数呢?这就叫灵巧思维么?下面的回答肯定不能让读者满意,但也只能献丑了。搞这些招数的目的 无非是为了模拟语言脑里某些化学或生命物质的奇妙功能。当然 要在一个物理系统里模拟那些奇妙功能,这些招数未必管用,但不搞这些招数,图灵机肯定没有指望。上列招数者 “概念范畴灵巧性符号表示”之要点也。

下面讨论第二个问题——概念林和概念树的灵巧性符号表示。

首先应该说明的是 概念林不过是概念范畴之间与概念树之间的一个过渡性概念,概念范畴的花样很多,不得不跟随许多招数,概念树的花样更多,将跟随更多的招数,过渡性的概念林相对比较单纯,可以用一位数字加以表示,概念树将继承这一单纯性。但这单纯性里隐藏着一项特别不单纯的因素,那就是关于共相和殊相的概念。概念林和概念树有共相与殊相之别,但不是每一个概念子范畴都存在共相概念林,也不是每片概念林都存在共相概念树。理性法官必须首先思考这个根本性问题,因为 它直接关系到概念林和概念树的最终设计能否符合或满足理性法官所要求的透齐性标准。这段论述的内容跨度相当于齐天大圣孙悟空翻了多个筋斗——太大了!所以 下面先回到“表:3大概念范畴的子范畴表示符号”,顺便描述一下语言概念空间的基本景象。

 

        表:语言概念空间的第一基本景象

 

    概念范畴    子范畴           概念林数  概念树数  共相概念林

 

基元概念   

主体基元概念       6  006    42  042

            第一类精神生活    (5,3,4,5)   (59)

    71        “心理”         5  011    19  061

    72        意志             3  014     9  070

    73        行为             4  018    11  081

    8         思维             5  023    20  101

    a       第二类劳动         9  032    61  162

            第三类精神生活     (5,3)      (32)

b         表层             5  037    20  182

d         深层             3  040    12  194    

    q6      第一类劳动         5  045    25  219

            第二类精神生活     (5,6)      (58)

    q7        表层             5  050    32  251

    q8        深层             6  056    26  277

基本概念   

  j       基本本体概念       7  063    21  298

    j       基本属性概念       2  065    16  314    

逻辑概念   

          jl      基本逻辑概念       2  067     6  320

    l       语法逻辑概念      12  079    55  375

    f       语习逻辑概念      11  090    37  412    

    s       综合逻辑概念       4  094    16  428     

具体概念   

jw      基本物概念         7  101    24  452

(r(o),g(o),pw;(o,x))

挂靠概念           2  103     4  456

(3,2)  ((1,2+3,2,4),2)

//((1,2+8,2,4),2)

  (12,2)//(17,2)               

 

“表:语言概念空间的第一基本景象”是对“表:抽象概念3大范畴及其子范畴的表示符号”的高层解读,解读的关键词是“第一基本景象”。该词把“第一”与“基本”捆在一起,读者可能觉得别扭。“基本”可以省略么?不能!因为该表仅描述了概念子范畴的共相与殊相特征,未涉及概念林。“第一”更是必须的,因为后面还有第二、第三和第四。第二对应于语句(SCJ),第三对应于语境单元(SGU),第四对应于记忆(ABS)。

此表的一系列细节将在下文逐步交代。

未读前两卷的读者可能对表中的某些符号感到别扭,特别是其中的r(o)和g(o)。果如此 则请翻阅一下本编第二章第3节里的“形态元素总表”。

“共相概念林”的存在与否是概念林层级的第一号问题。抽象概念子范畴不存在共相概念林的只有4个:“深层第三类精神生活d”、“基本属性j7与j8”、“语习逻辑f”和“综合逻辑s”,另外的13个都存在,这是在概念林层级的第一次灵巧思维运用。这里应该强调的是:共相概念林的存在与否在理论上有一定意义(例如对语习逻辑)或很有意义(例如对深层第三类精神生活),但在技术层面“无所谓”,即对初期的婴超和语超都无所谓,因此 读者也可以无所谓。

两类具体概念之一的“基本物jw”存在共相概念林,那么 对挂靠概念要不要给一个说法?回答是:没有必要。这是在概念林层级的第二次灵巧思维运用。

在概念林之上的概念子范畴层级 抽象概念和具体概念的子范畴描述方式各有特色,体现在“∑”栏目下的数字表示里,子范畴的数量可以有不同的说法,即灵巧思维的展现。

总体说来 灵巧思维在概念子范畴和概念林两层级的展现还比较单一,在概念树层级就完全不同了,先列出其灵巧思维展现的清单吧:

——共相概念树的存在性;

——概念延伸结构表示式的层级设置;

——开放与封闭类型的选择;

——各级本体论描述(OD)和认识论描述(ED)的选择;

——不同类型OD的选择,特别是其中“根概念”的选择;

——不同类型ED的选择,特别是对其中“反^”与“非~”的选择;

——不同挂靠方式及其表示符号的选择;

——符号“o01”和“okm”的运用。

    这个包含8项内容的清单概括了概念基元灵巧设计的主要或基本内容,但并非全部,例如 r强存在特性就不在清单之内,而对于某些概念基元(也叫延伸概念)来说 这一特性正是它的“核心利益”所在。

上面清单里的HNC术语和专用符号太多,请查阅本《全书》的术语索引吧。笔者希望 有心的读者能够把“本体论描述(OD)”和“认识论描述(ED)”这两个术语烂熟于心,即使你对哲学丝毫没有兴趣,也要力争把握住这两个术语。因为 稍稍有点深度的思考就离不开哲学,而哲学开启思维灵巧性之门的两把钥匙就是OD和ED。这两把钥匙属于思维领域最重要的世界知识,而不属于通常的专家知识,因此 许多专家(包括哲学专家)反而不了解这两把钥匙的妙用,就并不奇怪了。

 

1.1.3 概念基元有限性是语言概念空间(彼山)的第一公理

    在前两节 我们先叙述了概念基元有限性的必要性和充分性保证,接着以“表:抽象概念3大范畴及其子范畴的表示符号”和“表:语言概念空间的第一基本景象”为依托 对两项保证进行了纲要式说明。该说明非常粗糙,一些关键术语(例如OD和ED)蕴涵着内容逻辑的一系列重大课题。这些课题的HNC探索已获得重大突破[*07],因此 这里可以说 上述纲要式说明就是对概念基元有限性这一命题的形而上论证。这项论证过程紧扣着透齐性的脉搏,你可以依然怀疑是否真的达到或满足了透齐性要求,但你应该感受到这种紧扣方式的灵巧性。虽然许多环节的论述还有待下文,本小节依然有资格宣告:上述论证过程展示了非常清晰的灵巧思维,这样论证出来的东西就可以称为公理。概念基元有限性就是语言概念空间的第一号公理,该公理描述了语言脑的第一号内在特征。这又是孙悟空的筋斗么?你觉得呢!

 

结束语

本节是对HNC理论思考方式的概述,不得不写下了一些本来应该回避的话语,那主要是指关于“一竿子”思维和语言经典性论述的文字,但思考再三,最后还是决定“豁出去了”。所谓HNC理论思考方式其实就是指前两卷高频度使用的形而上思考,20世纪以来 形而上或形而上学在社会主义阵营和当下的第二世界变成了与辩证或辩证法完全对立的“过街老鼠”,这是最可悲叹的文化误会;在第一世界的各主流学界也都地位卑微,能打出“描述形而上学”旗号的学者已经是十分难能可贵的勇敢者了。卑微的笔者自知卑微之声只会招来不屑与讥讽,所以曾借助蕲乡老者的声音[*08],那当然是丝毫无济于事,不过聊以自慰而已。故本卷来一个别出心裁,以灵巧性替代形而上,“90后”或有兴趣乎?未可知也。

“表:语言概念空间的第一基本景象”及其说明罗列了HNC的全部核心概念,其中的部分概念和对应的符号未予任何说明,例如“第二对应于语句(SCJ),第三对应于语境单元(SGU),第四对应于记忆(ABS)。”大句里的术语。故直接阅读本节的读者必有“天书”之感,那就麻烦你灵巧一点吧。

 

注释

[*aaa] 这是本《全书》第二次提到林杏光先生,“林杏光先生的重庆遭遇”这个短语里所包含的内容需要一篇专文来叙述,这里仅略记其要。2001年 时任全国人大副委员长的许嘉璐先生曾在重庆召开过一次中文信息处理的高端研讨会。在那个会议上 林杏光先生尖锐指出了传统语言学研究的深刻危机,并系统阐释了他对HNC的认同和期许。林先生因此而遭到多位与会者的强烈奇特对待,笔者深感震惊。2012年初 许先生谈起林先生在重庆会议的发言,给予了高度评价。

[*00] “体说、面说、线说和点说”是HNC引入的一套术语,将简称“四说”。引入这套术语的目的在于与“透齐”或“透齐性”的术语相呼应。如果说透齐性是展现灵巧思维的“内功”,那么 “四说”就是展现灵巧思维的“外功”。这里特意使用了[*00]编号,以强调“四说”的特殊重要性。但非常遗憾的是 对“四说”的诠释或说明非常分散,读者先顾名思义吧。此处有所补充,后文还会继续。

[*01] 前者见《理论》…;后者见《理论》…

[*02] 《现范》对“语义”的解释如下:语言所表达的意义。包括词汇意义、语法意义和语用意义,即词语的概念意义、词语和句子由语法关系所产生的意义、词语和句子在交际中因适应语境所具有的意义

[*03] 康德关于理性法官论述的引文见《理论》…

[*04] “三语”说是笔者杜撰的术语,文献里有“三平面”、“三层次”、“三维度”等名称,但都名不副实,故以“三语”代之。

[*05]自然语言信息处理之劲敌与流寇的说明见…

[*06] 机器翻译是自然语言处理的一个应用领域,屡败屡战,其译准率始终未能超过70%的门槛,笔者曾把这个门槛叫做机器翻译技术的雪线或雪线现象,这里的“半世纪尴尬”是对对雪线现象的另一种表述。

[*07] 此话显得很不谦虚,本编第四章里将有所呼应。

[*08] 见第一卷附录里的《对话》和第二卷第八编第二章里的《对话续1》

 

 

第三卷 第一编 第一章 2 概念基元的抽象与具体两分

 

本节的标题合适么?抽象与具体对应于主观与客观么?如何运用灵巧思维?这三个问题是本节需要回答的问题。第一个问题将转化为“一个被疏忽的重大疑问”,第二问题将转化为“一场曾被过度重视的奇特争论”。第三个问题几乎是本卷每一节都必须面对的,标题则将因情况而异。

 

1.2.1 一个被疏忽的重大疑问

概念或概念基元的抽象与具体两分是HNC彼山描述最原始的起点,在这个起点上 就出现了一个重大疑问。该疑问有两面,如同一块硬币必有两面一样,一面是HNC对外界的疑问,将简称正问;另一面是外界对HNC的疑问,将简称反问。

正问的背景涉及到内涵与外延这一对逻辑学术语,内涵定义为“概念所指对象的本质属性的总和”,外延定义为“一个概念所反映的对象的全部范围”。正问的具体陈述是:所有概念都具有所谓的内涵与外延么?就作用效应链来说 其每一环节都拥有大量概念,但其“所指对象”可以“指”出来么?作用何所指?过程何所指?转移何所指?效应何所指?关系何所指?状态何所指?前文曾指出过 实质上它们都无所不指[*01],而一个无所不指的概念自然也就谈不上所谓外延(“对象的全部范围”)了。由此可见 并非每一个概念都具有特定的内涵与外延,因此 正问的答案是“否”,而不是“是”,逻辑仙翁是否把这么一个根本性的哲学问题给绕过去了呢?

绕过去不是有意的,而是一种疏忽。那么 怎么弥补这一疏忽?那就是把概念首先区分为两大类:必须确定“所指对象”的概念和不必确定“所指对象”的概念,HNC从一开始就这么做了,把前者叫做具体概念,把后者叫做抽象概念。就语言或语言脑的探索来说 似乎没有比这项弥补或区分更基本、更紧迫、更重大的事了,形象地说吧 抽象概念和具体概念的两分就是“表:语言概念空间的第一基本景象”的父母——亚当与夏娃。基本物概念和挂靠概念属于具体概念,其他都属于抽象概念,但抽象概念可以被挂靠,一旦被挂靠 就变成具体概念了,这就是思维灵巧性的展现。

反问的背景是“表:语言概念空间的第一基本景象”本身,它构成了一个命题,而该命题必然带来下面的疑问,其具体陈述是:在必须确定不必确定之间不存在模糊地带么?问得好!将在本节的第3小节回答。

 

1.2.2 一场曾被过度重视的奇特争论

“表:语言概念空间的第一基本景象” 可以给出如下的描述:基本物概念、基本本体概念和主体基元概念(作用效应链)属于一类存在,其基本特征是:与意识无关[*02];其他的概念属于另一类存在,其基本特征是:与意识纠结在一起。这就是说 对语言概念空间第一基本景象可采用这样一种简明的描述,那就是:存在着两类不同本质的存在,一是独立于意识的存在,二是与意识纠结在一起的存在。由此可见 哲学史上关于唯物论与唯心论的争论是一场被过度重视的奇特争论了,因为争论的双方对存在这个概念本身就没有形成共识,没有一个对“物”与“心”的明确定义,双方对“物”与“心”的认识高度还没有达到康德所提倡的透齐性标准。因此 基于这场争论而派生出来两大名言[*03]——“存在决定意识”与“意识决定存在”——之争就显得非常奇特了。汉语对于这类奇特的争论有一个很形象的描述:公说公有理,婆说婆有理。下文将把这个形象化描述简称“公婆之争”,公的理有理,而且是很了不起的理;婆的理也有理,也是很了不起的理。但人类既不能只听从公的理,也不能只听从婆的理,而是两边的理都要听。在工业时代以来的人类的现实生活中 既充斥着由存在决定的意识,可名之传统型惯性现实;也充斥着由意识决定的存在,可名之代沟型变异现实。农业时代以惯性现实为主导,工业时代以变异现实为主导,后工业时代将回归到惯性现实重新取得主导地位的状态。当然 这是22世纪之后的事,但它必将出现。这个回归说写在这里似乎很突兀,其实不然,因为它是文明主体三大公理[*04]的必然呈现。

两大名言之争是典型的“公婆之争”,这场争论的重要性曾被过度抬高了,这是马克思答案的后遗症之一。为什么要提起这个话题呢?因为“概念基元的抽象与具体两分”这样的命题很容易导致类似的争论或问题,例如:语言脑的进化历程是先有抽象概念还是先有具体概念?这样的问题一定会引发“公婆之争”,HNC不希望出现这样的效应或局面,若不幸而出现了这种情况,则应该以灵巧性原则予以对待或处理。在第一卷中 关于政治制度的民主与专制、丛林法则的博弈与超越、法治与德治、中华文明与西方文明的根本差异、民众与个人、英雄与时势、三个历史时代与六个世界、三种文明标杆与三帅(金帅、官帅和教帅)、需求外经[*05]与人类家园危机等等话题的讨论实际上都遵循着灵巧性原则。这是一个重要的表白,安置在本小节最为合适。但在现代语境里 “民主与专制政治制度的辩证表现”、“工业时代的柏拉图洞穴”这一类的命题难以获得立足之地,笔者的论述方式又比较“怪异”,因此 上述表白也许只会引起适得其反的效应,那只好听天由命了。

 

1.2.3“概念基元的抽象与具体两分”有资格充当语言概念空间的第一基本景象么?

    这里提出的资格问题包含理论与应用两方面,理论方面是指前述的反问,应用方面是指:它将成为婴超的有效工具。

    反问的要点是如何处理所谓的“模糊地带”,回答是:挂靠本身就是一种万能的灵巧处理方式。试想:任何抽象概念一经挂靠就可以变成具体概念,“模糊”不就不“模糊”么?不就使得“模糊地带”基本失去了存在的土壤么?这里用得上“天网恢恢,疏而不漏”这句成语,即使还存在一些“漏网之鱼”,也就无碍大局了。

HNC的早期论述里 曾将这“模糊地带”名之“两可性概念”,“两可”者 亦抽象亦具体也,“x”类概念乃其典型呈现也。

在资格的应用方面 这里只安排预说,一句话 “概念基元的抽象与具体两分”乃是扫荡流寇的有效武器,对流寇01(广义对象语块GBK的多元逻辑组合)、流寇09(体词多义)和流寇13(动态组合词)的处理(包括分析和变换)更是不可或缺。

 

 

结束语

本节的论述方式比较特别,以置疑逻辑仙翁的内涵与外延这一对人所熟知的术语开始,以语焉不详的预说方式结束。请习惯这种方式吧,因为它是灵巧性的一种表现。

在具体概念与抽象概念的定义里 使用了“必须确定”和“不必确定”的词语,并加了黑体。必须者 其所指对象一定可确定者也;不必者 其所指对象不一定可确定者也。语言哲学曾触及到这个问题的边缘,可惜都未能达到透彻性的高度,罗素先生关于“秃头法国皇帝”命题的著名论文就是一个典型的例子。

 

[*01] “无所不指”之说见

[*02] 这个说法存在一个明显的疑问:它适用于基本本体概念里的“数j3”么?这里不予讨论,请当作灵巧思维的一次微妙应用吧。

[*03] 两大名言曾分别名之第一名言(“存在决定意识”论)和第二名言(“意识决定存在”论),第一名言是马克思答案的理论基础;第二名言则是黑格尔哲学体系的理论基础。

[*04] 三大公理即政治公理、经济公理和文化公理,经济公理的论述安排在特殊概念树“效应心理行为7301\02”的“三迷信行为7301\02*ad01t=b”分节里([123-01021-2]),已撰写。政治公理和文化公理的论述则分别安排在“政治理念d11”和“文化理念d13”这两株概念树里,尚未撰写。

[*05] 这里列举的一系列术语中 需求外经的使用频度最小,故拷贝其原始描述如下:

需求外经是一部毁灭第一平常心的经,是一部破坏自然生态和毒化人文生态的经,是一部服务于过度幸福需求的经需要外经工业时代柏拉图洞穴的第一大经。“”者 超出了人均GDP上限也,超出了地球容纳限度也。

原文见“第一基本情感行为7301\31*\1”子节([123-0131-1])

 

 

第三卷 第一编 第一章 3 抽象概念基元的范畴三分

 

    本节及随后的3节主要是对HNC探索历程失误的回顾,对此不感兴趣的读者请保持耐心,最好不要跳过去,因为失误的启示意义可能远大于那些正确的名言。为什么这里要使用“正确的”这个修饰语?因为名言的绝大多数属于基本正确或局部正确的类型,此外 还有大量错误的名言,这些东西最好不要与“启示意义”挂钩。

在《理论》阶段 曾将抽象概念基元的范畴三分叫做三大语义网络,其原始论述拷贝如下:

为表达抽象概念的内涵,HNC设计了三大语义网络:基元概念语义网络、基本概念语义网络和逻辑概念语义网络。语义网络是树状的分层结构,每一层的若干节点分别用数字来表示,网络中的任一个节点都可以通过从最高层开始、到该节点结束的一串数字唯一地确定,这个数字串叫做层次符号。三大语义网络是抽象概念的三大聚类。(《理论》pp5-6)

    此原始论述存在4项巨大失误,3明1暗。

失误1是“语义网络”,这已经说过了。

失误2是“树状的分层结构”,这个短语沿袭了传统分类学的一竿子思维惯性,不明白该短语并不适合于语言脑之联想脉络特征的描述。在形式上 “范畴-子范畴”、“子范畴-概念林(群)”、“概念林-概念树”、“概念树-延伸概念”都是“树状分层”,但其本质特征有所不同。“范畴-子范畴”的“树状分层”最为简单,可大体沿用传统的上下位思维,但“子范畴-概念林(群)”和“概念林-概念树”的“树状分层”就完全不可沿用了,因为这里必须缜密把握共相与殊相的本质区别,对后者尤为紧要。“概念树-延伸概念”的“树状分层”则又是另外一番景象,这里不再存在共相与殊相的本质区别(第一本质区别),但存在本体论描述与认识论描述的本质区别(第二本质区别)。这是多么巨大的质变,惜乎概念研究的泰斗——康德先生和黑格尔先生——都没有充分认识到这个要点。因此 对“概念树-延伸概念”的“树状分层”就不能仅仅简单运用上下位之线说,还必须运用“封闭与开放”之面说或体说,将简称“-[*01],后者尤为紧要。

这里强调了两个要点:一是上述的两项本质区别;二是关于“封闭与开放”的“-”。这两个要点既不是长期冥思苦想过程的突然顿悟,也不是胸有成竹的预定设计。而是在反复调整“概念子范畴-概念林(群)-概念树-概念延伸结构表示式”的设计过程中逐步明确的,经历了一个漫长的“模糊-清晰”过程或“801-802”过程,将简称HNC历程。该历程有不同的类型,既有关于本质区别的不同类型,又有关于“-”的不同类型。下面仅给出关于第一本质区别的3个示例(范例)。第一类精神生活(71,72,73,8)的“四面体”设计、第二类精神生活(q7,q8)和第三类精神生活(b,d)的表层与深层设计 可名之HNC历程的概念子范畴范例;作用效应链的“二生三”设计(0,1,2,3,4,5)、第二类劳动(专业活动)的总体设计ay=0-8及其卫保活动a8设计、行为的总体设计73y=0-3及其形而上描述733和形而下描述733设计 可名之HNC历程的概念林范例;行为基本内涵730的概念树总体设计730y=1-3(对应于“心理”行为7301、意志行为7302和心态行为7303)可名之HNC历程的概念树范例。

第二本质区别的HNC历程范例这里就不来举例了,但应该强调指出 正是它和第一本质区别一起 构成了世界知识灵巧性表示符号的关键因素,而“-”则是灵巧处理世界知识与专家知识之间模糊地带的关键因素,也是灵巧处理语言脑与大脑另外4大区块相互交织性呈现的关键因素。总之 两项本质区别与“-”有可能成为窥视语言脑迷宫的指路明灯,在两者的引领下 语言脑的探索也许可以出现另一种景象,既不像《大脑如何思维》的作者那样没有主心骨,也不像《心灵的发现》作者那样陷于纯粹的思辨。

失误3和失误4对应于每一层的若干节点分别用数字来表示”里的“节点”和“数字”。节点这个术语的含义太宽泛了,概念树及其上位概念叫节点,概念树之下的各级延伸概$L太Wx趎ME$L太Wx趎谟锓ㄑУ淖从铩A嚼啾局侍卣魍耆煌亩 怎么可以使用同一个名称呢?宽泛可以是高明的概括,不能一概否定,但过度宽泛就需要警惕,容易陷入一竿子式思维的误区,状语就是一个典型[*02]。不是说节点这个词语一定不可用,但一定要慎用,如今对节点这个词语的偏好就值得警惕,因为其消极作用很类似于语法老叟对状语的偏好,此呼吁已发出过多次,这是最后一次吧。

失误4属于隐性失误,表面上似乎没有任何错误,实际上包含着两项重大失误,一是未提字母符号,二是未提数组。

    HNC理论对HNC表示符号的基本描述是:字母与数字都是概念或概念基元不可缺少的表示符号,并约定字母符号位居数字符号之前。但这个说法并不反映HNC探索的最初思路,与“表:抽象概念3大范畴及其子范畴的表示符号”也不完全一致。因此 这里作一个简略的回顾是必要和有益的。

抽象概念基元符号表示的最初设想是非常朴素的数字化形式,没有考虑字母的使用。16进制之数字e”和“f”的最早安排是分别用于基本概念和逻辑概念的表示,虽然这项安排很快就放弃了,但《理论》里仍保有不少印迹,“概念矩阵”的术语(见《理论》p18)是其中最明显的一个。

字母的使用也经历过一番不同寻常的HNC历程,这包括对希腊字母的钟情与放弃、强时代依赖性语境基元概念如何给予特殊照顾这两个特殊问题的反复推敲。与此同时 出现了对两个剩余数字符号“e”和“f”随意使用的情况。

反复推敲的最终结果就是形成了如下的7项约定。

约定1:不使用希腊字母,仅使用英语字母。

约定2:以字母“j”表示基本概念,虽然基本概念包含两个子范畴——基本本体概念(属于本体论)和基本属性概念(属于认识论),但仅利用jy的“y”之数字取值范围加以区分。即jy=0-6表示基本本体概念,jy=7-8表示基本属性概念。

约定3:以4个字母(j,l,f,s)分别表示不同的逻辑概念,不过 并非4个字母与4种逻辑简单直接对应,而是采取了“表:语言概念空间的第一基本景象”所给出的特殊对应形式:

    jl        基本逻辑

     l        语法逻辑

     f        语习逻辑

     s        综合逻辑

这一特殊对应形式是“一生二,二生四”的典范之一。这里“一”指逻辑,“二”指逻辑仙翁和语法老叟,对逻辑仙翁再“一分为二”而分解成基本逻辑jl和综合逻辑s;对语法老叟也再“一分为二”而分解成语法逻辑l和语习逻辑f。

约定4:以qy=6-8表示两类强历史时代性特征的语境基元概念——第一类劳动和第二类精神生活,两者分别采取了“表:语言概念空间的第一基本景象”所给出的特殊对应形式:

    q6        第一类劳动

    q7        表层第二类精神生活

    q8        深层第二类精神生活

这一特殊对应形式是“一生二,二生三”的典范之一。这里的“一”指强历史时代性特征的语境基元概念,“二”指第一类劳动和第二类精神生活,后者可以再“一分为二”,前者却不可这么简单地“再来一次”了。

字母q是强历史时代性语境基元概念的共相表示,殊相表示则分别以数字(6,(~6),9,c)来替换q[*03]。

约定5:以数字((71,72,73,8),a,(b,d))分别表示另外3类语境基元概念——第一类精神生活、第二类劳动和第三类精神生活。对第一类精神生活的心理子范畴给予了特殊照顾——使用了两位数字,因为心理不仅属于语言脑,也属于情感脑。

约定6:对语言脑内核的“内核”——作用效应链——给予最高级的待遇:“空”或“无”,即不赋予范畴标记符号。

约定7:以一位数字(0-b)分别表示每一概念子范畴的后续概念林(群)和概念树。数字0表示共相,数字(1-b)表示殊相。

7项约定是对“抽象概念基元的范畴三分”反复推敲的最终描述,是对“表:语言概念空间的第一基本景象”的再次解释,是HNC历程之灵巧性的充分展现:对不同的概念联想脉络采取了不同的思考路线,从而产生了不同的符号表示方式。

下面 交代一下关于“剩余数字符号”的使用问题。

由上列约定可知 数字(e,f)是未被使用的“剩余”,由“表:语言概念空间的第一基本景象”可知 数字(6,9,c)是未直接参与子范畴表示的“剩余”。这里有两类“剩余”:(e,f)和(6,9,c),其“剩余价值”如何利用呢?这似乎可以不管,但笔者却很费了一番心思,还是写出来留作记念吧。

第一个要说的 是关于“剩余”数字(6,9,c)的利用。这纯粹是一个人为制造的“剩余”,当年的如意算盘是:用它前挂于主体基元概念(作用效应链),从而给出语境的三层级粗略表示。三层级的内涵(定义)如下:

6 := 本能 =:(生理脑,大脑)

9 := 智能 =:(第一类劳动+第一类精神生活+第二与第三类表层精神生活)

        c := 社会 =:(第二类劳动+第二与第三类深层精神生活)

 

    这套符号表示或设计带有一种急于应用的不良倾向,但仍然具有一定的理论思考意义。曾为“本能6”设计的“6m=0-5”二级表示依然有效,它可能有助于未来“图灵机”常识性“智能”的开发。

    第二个要说的是关于“剩余”数字(e,f)的利用。这是在基本概念和逻辑概念引入范畴字母表示之后带来的一笔“意外之财”,它可以与具体概念符号p相挂接以形成两项特殊的字母数字组合:pe和pf,当年对此有一种“如获至宝”的感觉。于是就把pe用于组织(如政党、企业、国际组织等)的前挂靠表示符号,把pf用于“前组织”(如清教徒、什叶派、托派、“四人帮”等)的前挂靠表示符号。前挂靠符号pe与pf之间的交织性不强,不难区别,但pf与p-(不是语法学多数,而是以某种特定关系组成的一群人)之间的交织性却比较强。也许是由于这个缘故吧,HNC团队自身似乎就把pf取消了,把(pe,p-)混杂在一起。对此 这里就不作任何评说了。

最后要说的是数字(c,d;e)的特殊利用,特殊者 非单一数字也;而是以这三个数字为首的特定数字串也;专用于延伸概念之认识论描述也。该特定数字串的形式 读者已经比较熟悉了,那就是下列5种形式的组合:

    (cko,dko;c01,d01;eko)

4种组合用于不同类型对比性概念的描述,最后的eko用于非黑氏对偶性概念的描述。对eko曾使用过多种名称,这里正式宣告最终的选定:“非黑氏对偶”,上一行里的“非黑氏”使用了黑体,仅仅是为了表明这个意思。这里不能不说一声 黑氏对偶的HNC描述符号是“o”,那是黑格尔先生作过最深刻描述的一类对偶性概念,将简称黑氏对偶,它只是概念对偶性呈现的一类形态,而远非全部。专攻黑氏对偶,就是点说,兼攻黑氏与非黑氏对偶,那是线说,再扩展到各种类型(即上列5种组合的前4种)的对比性概念,那才能达到概念认识论描述的面说高度。由此再向前跨进一大步,兼攻概念的本体论描述,那才能达到概念描述的体说高度。因此 仅依据概念的黑氏对偶性去展开思辨,虽然也能获得许多光彩夺目的成果,但毕竟跳不出点说的局限性。点说的高论一定显得十分精辟,最容易引起盲目崇拜。那些喜爱引用“名人名言”的写者 要当心一点啊!

这就是说 概念的认识论描述总共有下列6种符号表示形态,将简称认识论描述总表。

         延伸概念认识论描述总表

    cko          对比性概念的两类状态型描述

dko          对比性概念的两类过程型描述

c01          模糊对比性概念的最小描述

d01          模糊对比性概念的最大描述

eko          非黑氏对偶

o            黑氏对偶

前文曾把这6种符号表示形态叫做语言理解基因的氨基酸[*04],本编第六章还会回到这个话题。语言理解基因氨基酸的完全发掘经历了长达20年的时间,在这漫长的时期里 HNC描述不断摆脱一竿子思维的束缚,提高灵巧思维的素质,“抽象概念基元范畴三分”的符号描述是该“摆脱-提高”过程的终极呈现之一,延伸概念之认识论描述总表亦然。

本节最后应该说明 《理论》时期已经注意到了“o”与“eko”的区分,那时使用的符号是“k”和“emk”(见《理论》p23),但对两者本质区别的认识还十分肤浅,仅仅写下了“上面的符号约定只表达了这一共性,但对于对偶性的一系列个性则未予表达”[*05]这么两句留有余地的话。这是两句“话里有话”的启示性话语,可惜始终未引起读者应有的注意。

 

结束语

本节未划分子节,系统回顾了HNC探索历程(文中简化成HNC历程)的重大失误,概括成4点,重点论述了失误2——对于“树状分层结构”的盲目跟随。坚持“原教旨”的树状分层结构将陷于一种一竿子思维的陷阱,“原教旨”的思考仅适用于概念范畴及其子范畴的描述,对于概念林和概念树 要引入共相和殊相的不同描述;对于概念树的延伸概念 要引入本体论和认识论的不同描述。考虑到这两类不同描述的极度重要性 特冠以第一和第二本质区别的名称,意在强调而已。对于延伸概念 还必须使用“面-体说”的描述方式。

四项失误的弥补贯穿于HNC探索的全过程,本节将最终敲定的结果概括成7项约定。从约定引出了“剩余数字”的特殊课题,对此 给出了详尽的描述。在该描述里安置了一段重要插写,那就是关于黑氏和非黑氏对偶的论述,随后给出了“延伸概念认识论描述总表”,并就便写下了一段关于点说、线说、面说和体说的举例式说明文字。本卷卷首语曾许诺过“希望撰写方式能有所改变”的话,这算是一次小小的努力吧。

    本节的注释[*02]提出了一个重要的话题,本卷第五编(论机器翻译)里会有回应。

 

 

注释

[*01]“面-体说”是新引入的术语,与“点-线说”相对应,前者专指“面说-体说”,后者专指“点说-线说”。前面曾对“点说-线说-面说-体说”给出了一个略称:“四说”。这样 已有了3个略称:“四说”、“面-体说”和“点-线说。麻烦读者记住吧。

[*02]为什么这里拿状语说话呢?因为在“主谓宾定状补”六大句法成分中 状语的误导或掩饰作用最强,它误导了语块的主辅之分,还充当着掩饰句蜕现象并扮演劲敌C的主要角色。后者主要出现在英语的高楼大厦里,汉语由于采用四合院结构而比较少见。这是一个很有趣的话题,关系到“英语信息处理比//远比汉语容易”的流行看法,这个看法是完全错误的。持有这种看法的人一定十分缺乏关于语言信息处理之劲敌与流寇的基本认识。这里只是借机预说一声。但上面关于误导、掩饰和扮演的话语读者一定很难理解,下面借助两个英汉对照的例子(例1前文已引用过)为读者解难。

——例1:

and Plato,aware that the ethics of his time were being penetrated by a deeper principle which,within this context,could appear immedeately only as an as yet unsatisfied longing and hence only as a destructive force,was oBtiged,in order to counteract it,to seek the help of that very longing itself.

柏拉图那时已意识到更深刻的原则正在突破而侵入希腊的伦理,这种原则还只能作为一种尚未实现的渴望,从而只能作为一种败坏的东西在希腊的伦理中直接出现。为谋对抗计,柏拉图不得不求助于这种渴望本身

——例2:

We are a nation has a government not the other around.Our government has no power except that granted it by the people.

我们是一个拥有政府的国家,而不是拥有国家的政府。除非人民授予,我们的政府就无权可言

1中有一个大厦式的状语——“,aware thatas a destructive force,”,例2中有两个“洋楼”式的状语——“has a government not the other around”和“except that granted it by the people”,有趣的是 它们都同时发挥着“误导、掩饰和扮演”的作用。汉语译文拆除了英语状语的大厦或洋楼结构,用四合院结构加以重组,于是 英语里存在的“误导、掩饰和扮演”现象竟然奇迹般地消失了。当然 这只是个例,然而 它们是两片知秋之叶,即使你还不能立即感悟到这一点,你也不应该依然坚持汉语的信息处理难度一定远大于英语吧!

[*03] 强历史时代性语境基元概念殊相表示的数字约定见…

[*04] 语言理解基因的预说见“期望行为7301\21”子节结束语[123-0121]。

[*05] 这里的“这一共性”指对偶性概念的对立统一性,不过 当时已对该共性提出了质疑,具体陈述是:“具体的对偶性概念可以没有统一方,例如‘左中右’是一个完整的对偶,但实际的‘手’只有‘左手’和‘右手’,不存在‘中手’,…”。

 

 

第三卷 第一编 第一章 4 基元、基本和逻辑概念的“6、2、4”分

 

本节和上一节的内容前文都已经论述过多次,这两节是典型的“炒剩饭”,也可以说是对“表:抽象概念3大范畴及其子范畴的表示符号”的再度或重复注释,这不是“多此一举”么?这个问题 笔者将采取老一套的回应——笑而不答。

上一节的内容适合于采用3个小节来论述,但未采用。本节面临着同样的选择,换个花样吧,理由就不说了。

 

1.4.1关于基元概念的6

基元概念6分说可以转换成(1,1)形态的特定两分说,(1,1)的对应概念关联式如下

(1,1) := (主体基元概念,语境基元概念)

请注意 这个特定两分属于不可交换的逗号(“,”)式两分,而不是可交换的加号(“+”)式两分。因为前者构成语言脑的内核之一,后者构成环绕着语言脑内核的核心圈,而内核与核心圈是不可交换的。

基元概念6分说也可以转换成(1,2)形态的特定两分说,(1,2)的对应概念关联式如下:

    (1,2) =: (1,1+1) := (主体基元概念,劳动+精神生活)

    基元概念6分说还可以转换成(1,5)形态的特定两分说,(1,5)的对应概念关联式如下:

        (1,5) =: (1,2+3) := (主体基元概念,两类劳动+三类精神生活)

这就是说 基元概念6分说只是一种说法,还存在着3种与之等价的特定两分说,仅盯着其中的一种或一种里的一部分 就叫做“一竿子”思维;轻盈地游弋于四者之间 就叫做灵巧思维。这种游弋功夫就是仰望与俯瞰并举,也就是康德式理性法官的基本功——透齐性。用汉语来说 这叫做境界,透齐性对应于王国维先生所描述的第三境界。

本小节是对“脑谜2号”说的呼应,现将脑谜2号的原始论述拷贝如下:

脑谜2号素描了语言区块存在着语言理解与语言生成的两分(这一点应是语言学界的常识,但实际情况并非如此);素描了理解区块的主体存在着作用效应链与理解基因的两分;素描了理解基因的主体存在着两类劳动和三类精神生活的区分

原文见意志篇(第一卷第二编第二篇)的跋。

 

1.4.2关于基本概念的2

上一小节说到:主体基元概念构成语言脑的内核之一。这“之一”使用了黑体,为什么?是为了弥补以往论述中的可能失误,使读者产生一种误解,以为主体基元概念是语言脑唯一内核。

HNC理论的原始设想是:语言脑的内核存在着3个核心小区块,主体基元概念是内核之一,基本概念是内核之二,逻辑概念是内核之三。但是 内核说始终没有明说,因为不敢,只好隐瞒。20年来 笔者一直在期盼着脑科学研究能提供一些可以明说的依据(包括反证),但不可期盼的态势是越来越明显了。时至今日 不能再隐瞒了,下面就姑妄言之。

语言脑的三内核不太可能集聚在一个区块里,因为语言理解区块和语言生成区块必然是分开的,而两者都应该拥有自己的内核。语言理解区块的内核必须包括主体基元概念、句类和语境单元,还应该包括基本概念和逻辑概念的“A部分”;语言生成区块的景象则似乎截然不同,其内核可以不包括语言理解区块必须包括的部分,但必须包括句式,还必须包括基本概念和逻辑概念的“B部分”。

这里提出了两个新术语:“A部分”和“B部分”,它们都带有临时性或暂时性,这是本《全书》撰写过程中惯用的手法之一,读者应该比较习惯了。“A部分”属于本小节,“B部分”是下一小节的事。两者又都有基本概念和逻辑概念的区分,将分别简记为“Aj”、“At”和Bj”、“Bt”以示区别,这里的t”取自type(类型)的第一个字母。

下面就来讨论“Aj”和“At”。讨论什么?一是它的内容,二是其不同内容在内核空间的“位置”。应该说明 这里的所谓讨论 不过是一种猜想而已。在猜想之前 要交代一个重要的细节。上文提出了语言脑内核和核心圈的说法,内核这个词语容易引起一个误解,以为语言脑内核是一个球状的东西。所以 这里要赶紧说一声“No”,语言脑内核的形态与球毫不相干,那就打个比方吧。笔者的建议是:语言脑内核的形态很像章鱼。内核既然是章鱼形态,那核心圈的形态也就不太可能是一个连续的环状体,并很难给出合适的比方了。

章鱼有很多的腿,“Aj”和“At”都是语言脑内核的章鱼。HNC猜想:“Aj”肯定是一只有9条腿的章鱼,但“At”是一条4条腿的章鱼么?这必须存疑。

Aj”章鱼的9条腿与基本概念的9片概念林(j0-j8)一一对应,这是可以断言的,故上文用了“肯定”这个词语。这9条腿的空间分布状态如何?它们之间会插入“At”章鱼的腿么?这些是有趣的科学课题,但HNC并不关注。下文仅略述“Aj”章鱼腿的某些猜想特征,将使用符号“Ajy=0-8”以便于描述,其意义不言自明。

首先要说的是“Aj2”,可名之“方位感”。它应该靠近图象脑,从而也比较靠近生理脑。这条腿的功能也许在所有的“Aj”中最为单一,弱联系于核心圈,其先天性特征最为突出,其性别差异十分明显。

其次要说的是“Aj1”,可名之“时间感”。它应该最靠近生理脑,并比较靠近情感脑。这条腿的功能也许在所有的“Aj”中最为复杂,强联系于核心圈的多项内容[*01]。其先天性特征也十分突出,不同个人之间的差异很大,但性别差异甚微[*02]。

第三个要说的是“Aj3”、“Aj4”和“Aj5”,可名之“科技感”,这三条腿都应该最靠近科技脑。前文[*03]曾有言:j3是科学的奶妈,量与范围j4是科学之父,质与类j5是科学之母这一比喻 对自然科学尤为适用。“科技感”的先天性特征或许仅次于“方位感”。“科技感”的性别差异也不容忽视,有人把这种差异主要归因于妇女歧视的千年社会传统,那是以偏概全的典型。其缘由无非是以下两点:(1)现代西方平等观的误导,(2)追随“金帅波澜”[*04]的时代潮流。

第四个要说的是“Aj5”和“Aj6”,可名之“艺术感”,这两条腿应该最靠近艺术脑,并比较靠近图象脑。“艺术感”的性别差异是一个十分有趣的话题,笔者的“艺术感”极度贫弱,在这方面完全没有发言资格。

第五个要说的是“Aj7”和“Aj6”,可名之“事业感”,这两条腿必然最靠近第二类劳动和表层第三类精神生活,同时也十分靠近第一类精神生活和表层第二类精神生活。

最后要说的是“Aj8”和“Aj0”,可名之“使命感”,这条腿必然最靠近深层第二和第三类精神生活。随着中国崛起势态的日趋明朗 中华文化复兴的话题近来提上日程了,这个话题的历史背景与现实景象非常复杂,关键在于要抓住它的核心,那就是要明确中华文明的特殊历史使命。当今第一世界的“使命感”太强,然而那只是一种表象,关键在于:该“使命”已沦为一种“逆历史潮流而动”的东西。此话过于离谱么?不!这“历史潮流”乃特指“拯救人类家园”的历史使命。第一世界的“领袖”或“精英”对此似乎处于茫然不知的奇特状态,第一世界之外的“领袖”和“精英”也好不到哪里去,要么盲目追随第一世界的主流,要么基于自身的特定信念和利益而盲目喊“不”。中国的现状与第一世界可谓“异曲同工”,表面上装作没有全球性“使命感”,关键在于:第二世界的“使命”本来就是一个从“空空如也”脱胎而来的东西,历来是“气壮如牛”其表,“色厉内荏”其里。前60年[*05]如此,后30年并没有本质变化,GDP和综合国力、软实力和文化产业都没有资格代替真正的使命感。此话过于荒唐么?不!对此有兴趣的读者 请翻阅一下第一卷里的《对话续1》吧,老者的精辟论述或许略有“解惑”之效。

At”章鱼的情况放在下面的小节作简略说明。结束语也放在那里一起写。

 

1.4.3关于逻辑概念的4

仿照上一节的比喻陈述方式 本小节要说明的是语言脑内核另外3种类型的“章鱼”:“Bj”、“Bt”和At”。

第一个要思考的是:Bj”章鱼也有9条腿“Bjy=0-8”么?答案应该是肯定的。那么“Bjy”与“Ajy”的异同性如何?这是非常有趣的科学课题,但HNC不拟思考,也无力思考。未来图灵机的研发可以回避此课题,但到了语超阶段 也许就需要面对了。

第二个要思考的是:Bt”首先要区分4种类型,分别符号化为:“Bjl”、“Bl”、“Bf”和“Bs”。四种类型的“Bt”可戏称4类“B”章鱼,要分别加以考察。

第三个要思考的是:Bjl”应该是所有B”章鱼中最关键、最特殊的一条。关键就关键在它是B”章鱼里最早进化出来的“品种”,特殊就特殊在任何语句都可以转换成该章鱼的第二条腿。从这个意义上讲 “Bjl”就是Bt”之祖。这些话语大有荒诞无稽之嫌,如果你有这种感觉,那并不奇怪,但这种感觉是完全错误的!那么怎么办?笔者的建议是:先翻阅一下“基本逻辑概念jl”编(第二卷第三编),细读其中的“比较判断jl0”小结([230-0]章的最后);接着细读“块间基本语法逻辑小结”([240-33]节的最后)。如果在这之后 你能明白“该腿的第二种形态”这个含混短语的确切意义,那荒诞无稽的感觉就会开始悄然消退,从而有希望向着灵巧思维的境界迈出关键性的第一步。

第四个要思考的是:“Bl”不过是语言之“色”(自然语言空间),如果对“色”与“空”(语言概念空间)的辩证关系(可简称佛理)茫然不知,则其掩蔽效应就必然十分强大。掩蔽效应 语言之共相(“空”)为印欧语系所掩蔽也;语言共相者 语言概念空间之彼山景象也。掩蔽之要者:以短语冒充语块也;以“句型”[*06]冒充句类也;以“句式”[*07]搅乎格式与样式也;以状语混淆语块之主辅之分也。掩蔽之最者 “动词中心论”也,使“主块乃句类之函数”这一基本彼山景象宛若“海市蜃楼”也;使特征语块EK之基本景象竟沦为“盲人之象”也,其中尤以“E+EH”、“EQ+E+EH”和“EQ+EH+E”最为突出也。

Bl”章鱼拥有12条腿:“Bly=0-b”,掩蔽特征最强的两条腿分别是其中的“Bl0”和“Bl6”。“Bl0”是“海市蜃楼”景象的缘起,“Bl6”是“盲人之象”的缘起。存疑于前者 请细读“主块标记l0”章(第二卷第四编第零章);存疑于后者 请细读“特征块殊相表现l6”章(第二卷第四编第六章)。

第五个要思考的是:Bf”虽然也是语言之“色”,但由于其语种个性极为鲜明,其掩蔽效应并不明显。“Bf”章鱼拥有11条腿:“Bfy=1-b”,腿的数量仅次于“Bl”章鱼。可以设想 这两条章鱼应该是语言脑内核最容易被观测到的东西,因为 文盲与知识强人的“Bl”章鱼应该有明显差异,只会母语者和会多种语言者的“Bf”章鱼应该有明显差异。这两项差异是语言脑内核观察的捷径之一,未来的脑科学实验研究 不妨考虑一下此捷径的利用。

第六个要思考的是:“Bs”的殊相特征最为突出,甚至可以设想 每个人的“Bs”章鱼形状将具有指纹一般的个性特征。该章鱼有4条腿:“Bsy=1-4”,每一条腿都具有这种指纹性特征么?非也,乃其中的“Bs1”和“Bs2”也。对这两条腿 可以提出如下的两点设想:(1)它们必然十分靠近语言脑核心圈里的“思维概念林8”;(2)分别以汉语和屈折语为母语的人 这两条腿的生理和结构特征都可能存在明显差异。这两项差异对于语言脑实验研究有什么启示意义么?这很值得思考。

最后要思考的是:“At”和“Bt”这两类章鱼之间是一种什么样的关系?思考的起点应该是:两者是“一分为二”还是“合二为一”呢?灵巧的答案只能是:亦分亦合,亦合亦分。这个答案太玄妙了是吗?对此不能像对待“Aj”和“Bj”那样采取回避策略,而需要进入各色章鱼腿的理解与应用特征这个重大话题。但这个话题与记忆和语言脑接口的奥秘密切相关,因此将放在本编第六章进行论述。

本节与上一节都是对概念基元的概述,相互呼应,下面小结一下。

上一节回顾了概念基元探索历程的一系列失误;说明了失误的缘由和纠正过程的的逐步到位情况;以7项约定为纲对概念基元的符号表示体系作了一次全面的梳理;重点阐释了概念联想脉络的基本特征:两项本质区别说-”。两项本质区别的第一项是:概念林和概念树之共相描述与殊相描述的区别特征,第二项是:延伸概念之本体论与描述与认识论描述的区别特征。这并不是说 人所熟知的上下位说不属于概念联想脉络的基本特征,而是两项本质区别更为关键和重要。那里 还以“认识论描述总表”为依托 对一般意义下的“面-体说”给出一个示例性说明,该示例具有典型性和启示性,值得细读。

在此基础上 本节提出了语言脑的内核区块和核心圈区块的假说;对内核区块的形态特征给出了比喻性的章鱼描述;对章鱼类型给出了理解(“A部分”)与生成(“B部分”)的基本区分;对各色章鱼腿的存在性作了不同视野的描述,包括其可观察性预期。这些描述或许对于未来的脑科学探索有所裨益,本卷的“展望未来”编(第八编)可能对此有所回应。

 

注释

[*01] 这里实际上提出了一个心理学话题,可名之“第一类精神生活的时间感表现”,内容极为庞杂,密切联系基本概念的“质与类j5”。

[*02] 这个大句描述“第一类精神生活的时间感表现”的部分内容。

[*03] 见“基本本体概念”编(第二卷第一编)的编首语。

[*04] “金帅波澜”是一个信手拈来的词组,它是“金帅推动的波澜”的略语。当今世界的文化、科技和教育领域日益商业化,这是金帅的历史性大手笔和大招数,并以令人眼花缭乱的方式向着专业活动全部9大领域的每一个角落巧妙渗透,使得人类生活方式的每一个角落都在被重新“装修”,人类精神生活的每一片美好天地都在被“拆迁”和被“变革”。这就是后工业时代初级阶段的世界景象,其壮观性空前绝后,空前性大约没有人反对,但绝后性肯定没有人认同。但 HNC确信:这就是“金帅波澜”的宿命,前文曾对此予以多个视野的描述。波澜不会永恒,“金帅波澜”不会例外,请记住这一点吧。

[*05] 这里使用了“前60年”的短语,而不是“前30年”,字面意义似乎与第二世界的定义不符,但实质是完全契合的。这里的历史缘由包括“社会主义阵营的东西两大战线”、“20世纪的两次十月革命”、“列斯毛专利的勃兴与崩塌”和“中华文明的独特断裂”这4项重大历史专题,前文皆有所论述。

[*06] 这个带引号的句型也叫句类,指语法学所定义的陈述句、疑问句、祈使句和感叹句。

[*07] 这个带引号的句式首先指语法学所定义的主动式和被动式,对应于HNC定义的基本基本格式;其次指英语以引词it打头的各种特殊句式,对应于HNC定义的…

 

 

第三卷 第一编 第一章 5 广义作用效应链的“二生三四”

 

本节与下一节的相互呼应性与前面的两节相类似。两节所描述的内容是概念基元总论(本章)不可或缺的构成,因为它们代表着HNC探索历程中两步关键性的跨越。但是 本节的内容前文已有足够的描述,下一节的内容与本卷第三编和本编第六章高度纠结。因此 这两节的撰写方式将别具一格。

从作用效应链的发现到广义作用效应链的成熟认定经历了十多年的漫长跨度,这简直有点不可思议。其中的缘由前文已多次说了,可以概括成两点,一是名人名言的误导,二是不明白公理无须验证的法则。所谓的“成熟认定”就是指本节标题里的“二生三四”。

“二生三四”表述了HNC哲学的核心思考,可简称“二生三四”说,其全文是:道生一,一生二,二生三四,遂成万物。此说不过是对《老子》名言“道生一,一生二,二生三,三生万物”的HNC表述[*01]。此表述里的“道”就是语言概念空间,但其“一、二和三四”则有特指与泛之分。本节的“一”特指广义作用效应链,“二”特指广义作用和广义效应,“三”特指作用和效应的各自三分,“四”特指三分之后的“作用//效应”与“判断//基本判断”相互之间的对应组合。

《老子》的“一、二、三”表述(简称《老子》表述)与黑格尔先生的“对立统一辩证法”表述(简称黑格尔表述)形式上似乎异曲同工,实质上差异很大。《老子》表述的视野更为宽阔,是本体论与认识论的综合,而黑格尔表述仅侧重于认识论。“二生三四”说同样适用于延伸概念的第一本体论描述和非黑氏对偶“eko”的认识论描述,从《老子》表述不难向着这个方向扩展,但从黑格尔表述推行这一扩展就比较困难了。这意味着“二生三四”说更接近于《老子》表述。

广义作用效应链的“二生三四”说是HNC语句理论的基础,是HNC理论从(HNC-1)推进到(HNC-2)的基本法则,基本句类就是依据这个法则演绎出来是。这个大句就当作是本节的结束语吧。

 

注释

[*01] 《老子》名言的HNC表述最初见

 

 

第三卷 第一编 第一章 6 语境基元

 

语境基元是概念基元的一种特殊类型,专指语境概念树的延伸概念,每株语境概念树之概念延伸结构表示式的每一项延伸概念就是一户语境基元,这就是语境基元的定义。请注意 这里未使用量词一个,而是一户,前者万不可用,后者比较传神。

下面举三类语境基元的例子。

1:“三争a0099t=b”

它是争权a00999、争利a0099a和争名a0099b的合称,三者构成语境基元的一户,而不是三户。

2:“期望与文明类型7121\k=6”

它代表六个世界各自的基本期望,六者构成语境基元的一户,而不是六户。

3:“第二品格7222ae2m”

它是稳健7222ae21与求变7222ae22的合称,两者构成语境基元的一户,而不是两户。

这三例语境基元表明 语境基元最后的数字符号通常是变量,但其前面的数字符号一定全是常量,这是约定。所以 可以把语境基元比作一个家庭,但不是一个家族,也不是一个家庭的单个成员。这里应该提醒一声 不要误以为不存在单个成员的语境家庭,上面故意没有给出这样的例子,这不是简单的课题,留作后来者思考和解决吧。

每户语境基元可享用同一个领域句类代码,这是如此定义语境基元的根本考虑。

语境基元是构成语境单元的载体,也是承载语言理解基因的载体。语境基元的数量等同于语境单元或语言理解基因的数量,前文关于语境单元或语言理解基因的估计数字都以此为据。

 

小结

前文曾预说过 HNC理论的全部内容最终凝练成HNC数学表示式(HNCm,m=1-4)HNC物理表示式(HNC-m,m=1-4),本章也可以说是关于(HNC1)和(HNC-1)的总论。

本章论述是以“表:语言概念空间的第一基本景象”为基础而展开的。…

 

 

 

                第三卷 第一编 第二章 五元组

 

引言

五元组在语言概念空间(彼山)的地位可以与词类在自然语言空间(此山)的地位相对应么?这是一个根本性的问题,但答案必须是灵巧性的,这意味着一竿子思维很难对此作出合适的回答。

从此山之“词语-短语-句子”视野和彼山之“概念基元-语块-句类”视野的对应性来说 五元组可以与词类相对应,五元组是关于概念基元形态世界的描述,词类是关于词语属性的描述。但是 五元组并非面向所有概念基元的形态世界,而词类则是面向所有词语的,这是五元组与词类的第一差异。其次 五元组之间具有灵巧的组合特性,而词类之间不具有这一特性。第三 五元组的特定元素(如r)具有强存在性特征,该特征仅属于某些特定的概念基元,词类也不具有这一对应特征。

基于上述 本章将设置下列4节:

1节 五元组与词类的异同概述

2节 五元组主要是对基元概念形态世界的描述

3节 五元组的组合特性

4节 五元组特定元素的强存在性

 

    上一章对语言概念空间(彼山)引入了第一、第二、第三、第三基本景象的术语,对第一基本景象进行了系统论述。本章将引入底层、中层和高层景象的术语。每一类基本景象都有底层、中层和高层景象的区分。就第一基本景象来说 底层景象即五元组;中层景象即概念树和概念延伸结构表示式;高层景象即概念关联式和语言理解基因。本章乃对第一基本景象之底层景象的描述。

 

 

          第三卷 第一编 第二章 1 五元组与词类的异同概述

 

本节将以下列3个小节展开论述:1)五元组与词类大异而小同;2)五元组的缘起;3)五元组究竟是什么。

 

2.1.1五元组与词类大异而小同

五元组的HNC符号描述是(v,g,u,z,r),与词类的奇特对应关系如下:

   

表:五元组与词类的奇特对应及其他

       

        HNC符号     HNC说明                    词类命名

          v         概念的作用(动态)描述      动词

          g         概念的状态(静态)描述      名词

          u         概念的属性描述              形容词、副词

          z         概念的值描述                量词

          r         概念的效应描述              名词

     CF         无元组,也叫概念形态,

CF取自Concept Form 的第一个字母。

     CFe        五元组元素,也叫概念形态元素或形态元素,

                是(v,g,u,z,r)通名,e取自element的第一个字母。

 

《理论》里 对(v,g)的说明文字是括号里的“动态”和“静态”,它们依然可以使用。这里以“作用”和“状态”替代 是为了便于下面的诠释。

此表最明显的特异之处是:传统语言学里地位显赫的介词和连词竟然没有出现,而名词却对应于五元组里的两元:g&r”,故该表的名称里使用了“奇特对应”的短语,这已足以表明五元组与词类大异而小同了。

概念基元者 语言概念空间(彼山)之底层要素也;语词者 自然语言空间(此山)之底层要素也。五元组者 乃概念基元之自然属性也,亦即第一基本景象之底层景象也;词类者 乃语词的自然属性也 亦即自然语言空间之底层景象也。简略言之 大异者 五元组与词类乃分别属于彼山与此山之底层景象也。

在彼山的俯瞰视野里 首先看到的景象是:存在着三大概念范畴——基元概念、基本概念和逻辑概念——的区分;接着看到的景象是:三大概念范畴的五元组特征呈现度[*01]存在巨大差异,基元概念极为丰富;基本概念比较单调;逻辑概念十分各色。再接着看到的景象是:逻辑概念4个子范畴的各色特征存在巨大差异,语法逻辑的不同概念林之间也存在巨大差异。

将彼山景象与此山景象联系起来看 语法学的8大词类实质上是3大概念范畴的一种有严重畸变的投影。产生这一严重畸变的原因在于没有对概念的形态与概念的内容加以区分,而是稀里糊涂地混淆在一起。“名动形副”属于概念的形态,而“介、连、代、叹”[*02]属于概念的内容。把两者包装在一起变成一串“糖葫芦” 实在是一款高明的魔术。这里可以说一说这款魔术的效果,那就是:基本概念在该投影里完全消失了;基本逻辑概念幻化成系词和情态动词;语法逻辑概念分别幻化成介词、连词和代词;语习逻辑概念的绝大部分“转业”[*03]了;综合逻辑概念的小部分也幻化为介词,大部分则“移民”[*04]了。

大异就说这些吧,下面略说一下小同。

对于上述投影里的畸变性或不协调性 语法学是有所觉察的,也采取了相应的补救措施。例如 从动词里分离出了系词;从名词里分离出了代词,对名词给出了普通名词和专用名词的区分,汉语语法学还搞了一个区别词,对代词又作了进一步的细分。这些努力可以概括成一种典型的分析方式——再分离,HNC历程受到这一努力的启发,五元组里的“g,r”和“u,z”也是一种再分离,不妨说成是“步其后尘”,这就是小同的基本内容吧。

 

2.1.2五元组的缘起

前文有言:(1)主体基元概念构成语言脑内核的“内核”,语境基元概念构成环绕着语言脑内核的核心圈;(2)基元概念的五元组特征呈现度极为丰富。这个大句与五元组的缘起有什么关系呢?回答是:五元组与基元概念是被同步发现的,或者更准确地说:五元组和主体基元概念(作用效应链)的被发现是同步发生的。任何发现都一定存在一个特定的起点或激活点,重要的是:必须灵巧地抓住那个激活点,才可能有所发现。五元组和作用效应链的共同激活点就是作用效应,而抓住之妙就在于对“道生一,一生二,二生三,三生万物”(将简称为“生生效应”)的灵巧运用。作用效应链的“生生效应”前文已说过多次了,那么 五元组的“生生效应”应该如何描述呢?下面的三步说可作为选择之一。

第一步是从两元组(g,u)变成三元组(v,g,u),

第二步是从三元组(v,g,u)变成四元组(v;g;u,z),

第三步是从四元组(v;g;u,z)变成五元组(v,g,u,z,r)。

这个三步说是对前述的HNC语言进化说[*05]的直接呼应。这个论断的跳跃性很大,下面先做点准备工作。

彼山的三元组(v,g,u)景象在此山是充分显露的,多数自然语言都有赤裸裸的呈现,对应的东西就是动词、名词和形容词。不过 三种代表性语言的赤裸裸程度有巨大差异,笔者只知道前两位代表的情况,英语最激进,彻底赤裸裸;汉语最保守,裹得很严实。

四元组(v;g;u,z)景象或“u”之“u,z”两分景象在此山呈现为“犹抱琵琶半遮面”的“诗情画意”,汉语的“琵琶”就是那名目繁多的量词,英语的“琵琶”就是那各色各样的单数与多数的形态之分。

五元组(v,g,u,z,r)景象或“g”之“g,r”两分景象在此山是高度隐蔽的,完全不露痕迹,所有的自然语言可谓不约而同。

此山的“赤裸裸呈现”只是彼山本相的部分展现,不是全部。“琵琶”对本相的全部展现起了干扰作用,“不露痕迹”则起了遮蔽作用。这样回过头再去看那英语的“赤裸裸呈现”,反而给人一种“面具欺骗”的感觉,而汉语的保守反而使人感到真诚。从这个意义上说 笔者更支持《现汉》的做法,不标注词性。标注“名、动、形”能起什么作用呢?能确保其引导性大于误导性么?对汉语的抽象词语 这是完全没有保证的,甚至可以反过来说 其误导性比引导性更大。那么 为什么《现范》和众多的词语知识库建设者还要为此辛勤付出?我们是否陷入了一种甘愿受骗上当的离奇状态呢?在HNC历程的前3年(1989-1992)时间里 这个疑团一直挥之不去,直到作用效应链和五元组的同步发现。

作用效应链的6个环节缺一不可,要平等对待。但面对不同语境基元概念及其概念林或概念树的描述 并非总是要求6个环节一同上马,多数情况要求有所侧重,突出主要环节。在第一类精神生活里 经常需要突出关系这个环节;在表层第二类精神生活里 经常需要突出转移这个环节;但在第二类劳动里 却经常需要一同上马,在那里 延伸概念使用符号β的频度最高,深层次原因这在于此了。以上所说 属于概念内容描述的有关思考,那么 概念的形态描述是否也需要类似的思考呢?不言而喻 答案是肯定的,这是五元组发现的直接起点或激活点了。

上文的“不言而喻”从何而来?来于“一个概念就是一个世界”的论断,它不过是“A word is a world”的翻版。在笔者心中 此论断是“面-体说”的典范之一。我们已经看到 “表:抽象概念3大范畴及其子范畴的表示符号”和“表:语言概念空间的第一基本景象”提供了一幅概念内容世界[*06]的“面-体说”描述,该描述呈现出来的景象很耐人寻味。但探索者不能因此而满足,一定要继续追问下去,概念形态世界存在符合“面-体说”要求(标准)的现成描述么?八大词类说具备这个资格么?

答案显然是否定的。八大词类是语法老叟和逻辑仙翁共同开设的一家老牌“杂货店”[*07],当然不同凡响,但“杂货店”毕竟不是“专卖店”,而概念形态世界的“面-体说”描述需要一个“专卖店”。

该“专卖店”推出的产品叫五元组(v,g,u,z,r),该产品的老“说明书”早就公布了,见《理论》和苗传江博士的《NHC(概念层次网络)理论导论》,这里发布一份新“说明书”,那就是“表:五元组与词类的奇特对应”。不过 老“说明书”的核心内容并没有删除,而是放在括号里了。新“说明书”突出了五元组各元素的两类不同来源:作用效应链的“作用、状态和效应”和基本概念的“属性、数和度”,而老“说明书”却混淆了两类不同来源的深层思考。这项混淆是很容易蒙混过关的,因为动态是作用的根本属性,而静态是状态的根本属性。或许有人会问:作用、状态和效应不是概念内容那一方的东西么?怎么又跑到概念形态这一边来了呢?问得好!如果把“表:五元组与词类的奇特对应”里的(作用,状态,效应)后面加一个“型”字或“性”字,你的疑问是否会有所减弱呢?如果是这样,那你就在学习灵巧思维方面迈出了一小步。作用效应链的6个环节 作用与状态是其两端,就概念形态的“面-体说”描述而言 “叩其两端而竭焉”是办不到的,或者说 仅选择两个代表是不够,还要加一个代表,以形成“三个代表”,那第三位代表就是效应。

代表说是概念林或概念树之透齐性设计的灵魂,前两卷曾反复请出不同的“代表”,部分段落还对“代表”的合法性或正当性进行了比较细致的说明,那都是灵巧思维的运用或展现,这里不过是又一次具体运用而已。五元组的创新性主要体现在“r”的发现,这一点将在第4节作进一步的回应。

本小节最后 简略交代一下两个“细节”问题:一是三大概念范畴的排序问题;二是五元组新老“说明书”的接轨问题。

基本概念这个概念范畴似乎具有至高无上的地位,因此 有些HNC著作就把它排在所谓“概念节点表”的第一位,把基元概念排在第二位,随后是各类逻辑概念。这个突出基本概念的排序方式并不符合“语言脑内核及其核心圈”假说的思考方向,这是需要指出来的。至于“概念节点表”的名称 笔者已经表过态了,这里加一句话,该名称虽然适用于HNC的通俗性读物,但也最好别用。

五元组的老“说明书”基本属于形而下描述,而本小节的新“说明书”则着重于形而上论述,接轨问题并不重要,省了吧。

 

2.1.3五元组究竟是什么

本小节的标题笔者曾思考良久,曾设想过使用“五元组是语言脑的难解之谜,但语超未必如此”的大句,形式上虽然放弃了,但下面的内容大体上是围绕着这个大句而展开的。

五元组是抽象概念基元的一种呈现,也可以说是抽象概念基元属性的基本呈现。这里的抽象概念基元是指语言概念空间的一类基元,简称概念基元,简记为CP。符号CP里的C就是HNCC,可以直接对应于语言脑,这样 符号CP就可以对应于语言脑里一组神经元。

上一段描述是对五元组的正式描述(《全书》描述),现在重温一下《理论》的相应描述,拷贝如下:

五元组(v,g,u,z,r)

指抽象概念的类型特征,分别代表概念的动态、静态、属性、值和效应表达。每个抽象概念都具有这五个侧面的类型特征,也可称为语言概念的形态或外在特征(p18)

两种描述并不存在实质性的区别,也不存在粗糙与细致之分。不过 《理论》描述刻意回避了语言脑及其神经元组的话题,《全书》描述把这个话题摆上台面了;另一方面 后者强调了概念基元,这就把“概念范畴、概念林和概念树”回避掉了。

《全书》里摆上台面的话题把HNC理论本来隐藏着的一个巨大困惑或陷阱凸显出来了,那就是:五元组在大脑皮层里存在对应物或对应物质么?不存在是难以想象的,而如何存在更是难以想象的。所谓“五元组是语言脑的难解之谜”就是指这两个“难以想象”了。而所谓“语超未必如此”则是指:对每一个抽象概念基元 可以赋予相应的无元组描述,并通过捆绑词语库把彼山景象与此山景象联结起来,以实现相互映射的技术目标。

总之 “五元组究竟是什么”是HNC理论的一项隐忧,下节还要回到这个问题。

 

结束语

    本节基于彼山和此山都存在着底层、中层和高层景象的思考 提出了五元组乃是“彼山第一基本景象之底层景象,而词类乃是此山底层景象”的论断,揭示了八大词类说的魔术或“杂货店”特征;追溯了五元组与作用效应链乃是一对孪生兄弟的渊源;素描了内容世界和形态世界的奇妙差异;最后交代了HNC理论的一项隐忧:五元组究竟是什么?

 

注释

[*01]“五元组特征呈现度”也许是第一次出现的短语,可以理解为五元组之5项元素的分布特征,下文使用了“丰富”、“单调”和“各色”三个词语加以表述,丰富的意思是:五元组的5元素一定全都存在,但分布形态千差万别;单调的意思是:5元素也全都存在,但分布形态趋于划一;各色的意思是:5元素不全存在,通常以某一元素为主。

[*02] 本节沿用了八大词类的传统说法,但此说比较粗糙,因为它没有包括冠词、数词和量词。屈折语大约都对冠词特别认真,对量词比较马虎,汉语反之,这很有趣。黏着语的情况待查。数词的情况应该是大同而小异,可能都有“十、百、千”吧。但“万”和“亿”为汉语所专有,“million”(百万)和“billion”(十亿或万亿)为英语所专用,这也很有趣。

[*03]“转业”的意思是分别转入句法学和修辞学。

[*04]“移民”的意思是跨入语义学或认知语言学。

[*05] HNC语言进化说见

[*06] 这里的“概念内容世界”是“概念基元的内容世界”的略称,为陈述的方便而从略,这一点务请读者注意。下面的“概念形态世界”短语同此。

[*07] “杂货店”说不过是上一节“魔术说”的另一种表述,请对照。

 

 

        第三卷 第一编 第二章 2 五元组主要是对基元概念形态世界的描述

 

    本节不分小节,也不写结束语。

本节的标题显得臃肿,但明确而不含糊。

臃肿的第一表现是“主要是”,第二表现是“形态世界”。

第一臃肿试图再次强调:基本概念和逻辑概念的五元组特征并不突出,但基元概念是十分突出的,主体基元概念尤为突出。

第二臃肿试图再次强调:每一概念不仅存在一个内容世界,还存在一个形态世界,五元组乃是对概念形态世界的描述。许多读者可能不容易接受“概念形态世界”这个短语或术语,那就请你想一想“一个人的神态”和“一件艺术品的品位或韵味”这两个短语吧,这“形态世界”就对应于“神态”、“品位”或“韵味”,概念之有“形态世界” 就如同人或艺术品之有神态、品位和韵味一样。然而 一个概念可以比作一个人或一件艺术品么?什么样的思维习惯会坚持说“不可以”呢?那就是前文多次提到的“一竿子”思维了。不过 当下的世道很奇妙,越是“一竿子” 越能在媒体世界走红,北京大学的一位粗口教授因此而名利大丰收,媒体世界应该对此有所反思。

五元组是概念的一种形态特征,概念与其形态特征之间的关系是包装体与包装品之间的关系。屈折语通常不在包装体方面花费多少心思,却在包装品方面花费大量心思去精心设计,其代表之一的英语当然不会例外;孤立语的汉语则恰恰相反,在包装品方面几乎没有花费什么心思,却在包装体方面付出了大量心思。古汉语研究可以说乃是针对语言包装体心思的研究,而西方语法学则主要是针对语言包装品设计的研究。从这个源头开始 就促成并最终形成了两种截然不同的语言研究思路或研究路线,从词语到语句以至篇章皆一以贯之。下文将把西方的语法学研究叫做语言包装品路线,把古汉语的“文字、声韵、训诂”研究叫做语言包装体路线。当然 包装品路线并非完全抛开包装体不管,但主要是涉及包装体的历史演变与地域差异。

上面提出了语言的两样东西:语言包装体和语言包装品,两者都属于自然语言,自然语言为语言脑所使用,但语言脑必然拥有自身的东西,那就是第三样东西了。如果没有这个第三样东西 语言脑是不可能学习并使用自然语言的,也不可能区分语言包装体和包装品。应该说 在西方语言学家里 乔姆斯基先生是第一个产生了如此明确的想法,他为那第三样东西取了一个响亮的名字,叫“Universal Grammar”,简称UG。乔先生对UG的诠释非常到位,可惜他对UG的研究依然沿袭了包装品路线。笔者当年(1989-1990)确实是以一种十分惋惜的心情想起了“必也正名乎”的教导,决定以HNC正名UG。所以 HNC这个名字实质上就是那个第三样东西的正式命名,也可以说是语言脑的别称。这个名字意味着要远离包装品路线,并同时靠近包装体路线。当年的强烈直觉是:语言包装体里所蕴涵的心思与HNC的距离应该比较亲近,而包装品设计里蕴涵的心思则跟HNC的距离十分疏远。

    应该说 汉字的奇妙确实为(HNC1)和(HNC-1)的发现提供了无与伦比的素材便利,但就HNC数学和物理方程的整体而言 最大的启示还是得益于康德先生的理性法官妙论。随着(HNC3)和(HNC-3)的发现 当年的强烈直觉出现了微妙变化,亲近感和疏远感都逐步减弱了。到决定撰写《全书》的时候 对两条路线的专家知识实际上已经不存在亲疏之分了。有趣的是 这种变化与本节的内容具有最密切的联系,下面就来对此略加说明。

两条研究路线都存在着同样的遗憾:对基元概念的内容世界和形态世界都没有形成清晰的认识,产生这一遗憾的根本的原因是什么?那就是:不明白抽象概念存在着三大范畴(基元、基本和逻辑)的区分。基元概念是三大范畴的主体,如果连它的存在性都没有闹明白,那当然也就谈不上内容世界和形态世界的话题了。包装体路线注意到了抽象概念和具体概念的区分,这不是一件小事,而是一件大事。在这一点上 包装体路线比包装品路线高明,故在《定理》里曾以“尔雅原则”强调之。但应该指出 《尔雅》和《说文》虽然展示了一幅美轮美奂的字世界,也许接近或达到了字世界的体说高度,但字世界体说所描述的毕竟只是此山景象,而不是彼山景象。两条研究路线对于揭示两山景象的天壤之别似乎都难以有所作为,这并不是一种猜想或估计,而是一种可以感受到的事态本相。随着基元概念全貌的日趋明朗 随着内容与形态两世界的真容日益显露,这种感受也随之日益加强。在前两卷的撰写过程中 每次写到“r强存在”这个短语的时候 那种感受就会光临一次,而上一节提到的隐忧也会同时光临。

本节臃肿的标题实际上是对本节内容的一种限定,该限定的目的在于便利以上的论述。现在应该把这一限定取消,以便说几句形而上的话语。

形态世界必有自己的有限形态元素,五元组的5个形态元素实质上就是抽象概念之形态世界的全部元素。因此 五元组也就是形态世界的主体,这如同作用效应链是基元概念的主体一样。具体概念也有自己的形态元素,将在下文说明。这样 如同内容世界存在抽象与具体两分一样 形态世界也存在主体和外围的两分,也可简称内外两分。五元素是主体形态世界,而具体概念的形态元素将构成外围形态世界。本节曾想过使用标题:“五元组究竟是什么?”本段的形而上话语就是该问题的答案了。

最后 还应该说几句题外话。

不言而喻 五元组的5元素各自扮演着5种不同的角色,但是 这特定的“5”也可以给出不同类型的两分或三分,比如说 一种可以优先考虑的两分选择是:基本角色和特殊角色。那么 不同的概念范畴、概念子范畴、概念林和概念树是否拥有不同的基本角色或特殊角色呢?这是一个具有理论与应用双重意义的大课题。下面仅“叩其两端”而举例试说之。

就概念范畴而言 基元概念的(v,g,u)必须纳入基本角色,“r”必须纳入特殊角色;基本概念的(g,u)可纳入基本角色,“v”可纳入特殊角色。

就概念树而言 势态判断和情态判断的“u”应纳入基本角色,“r,v”可纳入特殊角色。

 

 

          第三卷 第一编 第二章 3 五元组的组合特性

 

HNC的传统文字论述中 这是一个最不清晰的环节。五元组的五元素可相互组合,但从未给出过正式的文字表述,这是HNC历程众多可避免事件中最怪异的一件。该怪异造成的混乱很难彻底清理,前两卷里 曾给出过五元素组合的大量示例,其中的失误在所难免。

造成此怪异事件的根本原因是:在HNC历程的初期 对概念之共相与殊相特征的认识还比较浅薄,描述和处理两者关系的能力必然有限,因此就使出“以不知为知”的本能了。

五元组的各元素可相互组合,这是五元组的共相,但不同元素的组合特征又必然有所不同,这是五元组的殊相。

五元组的相互组合包括各元素自身之间的相互组合么?字面意义似乎是不应该包括的,但实际上是包括的,这纯粹是一项约定,不必细究其合理性。

五元组形态概念之间的相互组合是并联还是串联?

五元组各元素的组合特征存在个性差异么?

上列3个问题将构成本节的3个小节的源头,3小节命名如下:

小节1:五元组的互组合与自组合

小节2:“同行优先”原则的回顾与期待

小节3:五元组各形态元素组合特征的内外之别

 

2.3.1 五元组的互组合与自组合

本小节以两个分节进行论述。

 

2.3.1-1 五元组的互组合

五元组的互组合就是指五元组不同元素之间的两两组合,即不考虑两元素以上的组合。这并不是说那样的组合一定不存在,只是暂时不予考虑而已。

五元组不同元素之间的两两组合总计有20种形态(排列),但每种形态都拥有自身的特定意义么?这是一个很有趣的话题,答案也十分有趣,那就是:在这20种形态里 只有“gr”和“rg”不具有自身的特定意义,可以排除在五元组互组合的队列之外,这就是说 五元组的互组合实际上只有18种形态[*01]

下面 对于这18种形态的互组合给予“抓两头,带中间”方式的简要说明。为说明之便 将反复使用彼山和此山的术语。

以“v”为核心的4种组合形态是(vg,vu,vz,vr)。此山没有对动词作出这一区分,但在彼山的视野里 这一区分极为重要。语法学根本不管这件事,语义学也没有管这件事,请HNC的后来者管起来吧。

以“r”为核心的组合形态只有下列3种:(rv,ru,rz),因为“rg”被默认为“r”,这实际上就是“r”的源头或定义。

    以“u”为核心的组合形态是(uv,ug,uz,ur)。此山注意到了(uv,ug)的区别,但没有管另外两种,大约是都并入到“ug”里去了吧。

 

2.3.1-2 五元组的自组合

形式上 五元组的自组合应具有下列5种形态:(vv,gg,uu,zz,rr),此山似乎只注意到了其中的一种,那就是“uu”,但在彼山的视野里 这是一个明显的漏洞。(vv,gg,zz,rr)的存在性是显而易见的,怎么会陷于被熟视无睹的奇特状态呢?汉语的“进行、做、作、搞、去、来、…”等不就是典型的“vv”么?英语也有类似的“get,make,go,…”呀;汉语的“类型、方式、专业、工作…”等不就是典型的“gg”么?英语也有对应的东西呀;汉语无比丰富的量词不就是典型“zz”么?英语虽然抽象概念的量词极为稀缺,但具体概念的量词与汉语相当呀;汉语的“主义、浪潮、学、风、热、…”等不就是典型的“rr”么?英语也有对应的东西呀。

应该反思的是 对上列“么? 呀”系列所提出的问题一直停留在一个“到此为止”的游击状态。

不过 该游击战曾取得两项战果:一项是理论性战果,叫“同行优先”;另一项是工程性战果,没有命名,仅给出了符号(vv,zz),两者被赋予了特定意义,在词语知识库的建设方面获得了实际应用。

两项工程符号原则上不属于本《全书》的讨论范围。不过 这里还是要顺便说一声 HNC团队内部 工程性的概念或术语比较容易被接受并传播,而理论性概念或术语则往往遭到冷遇。这是当今时代的悲剧景象,笔者早已习以为常,但不能不表示一点伤感。

 

2.3.2 “同行优先”原则的回顾与期待

“同行优先”曾被当作一项原则在《理论》里加以宣扬,那是HNC历程初期游击习气的典型表现。这里应交代一声 最原始的“同行优先”仅指相同或不同五元组概念之间的相互组合,与本节定义的互组合和自组合完全不是一回事。不过 那场游击战代表了HNC对语法经典描述的一系列反思,促成了一些特定概念家族的问世,列表如下:

 

       表:“同行优先”原则促成的特定概念家族

           (反思对象放在括号内)

    类型                  家族成员

    并联                  (CFe+CFe);(CFe,CFe)

    (联合)

    基本串联              (ou,ov,vo;xo)

    (偏正,动宾,主谓)

    EK复合构成            (EQ+E,E+EH,EQ+E+EH,EQ+EH+Ef)

    (动补,动词中心论)

    基本概念短语          (时间短语,空间短语,数量短语,质类短语)

    (汉语短语与句子同构论)

 

    表中的文字大体对应于原初的表述,字母表示符号的大部分是后来逐步加进来的。

以上所说 是回顾的引子。下面的正式回顾将从串联与并联的概念谈起。

串联与并联是语法逻辑的核心内容,在语法逻辑编(第二卷第四编)的论述中 它是一项贯彻始终的东西。

这里要为英语叫一声好,因为英语确实为串联与并联的辨识准备了一整套近乎完美的区别符号,对比之下 汉语确实显得十分落伍,这种形态方面的先天“缺陷”不可改变,也不必改变[*02]

提出“同行优先”术语的初衷就是为了缓和汉语的这一困境。

同行的前提是五元组的形态元素相同,形态元素相同的概念优先于并联,形态元素相异的概念优先于串联,这似乎是一条“铁律”,但可惜它只管了概念的形态而未涉及概念内容,其管辖功能必然有限。为了把内容包含进来 扩大其管辖功能,就产生了“同行”这个概念,“同行”者 乃同一概念范畴、同一概念林或概念树、同一延伸概念之通称也,无关于概念形态元素之是否相同也。

于是 “同行优先”的想法或概念就应运而生。但那个时候 概念范畴-子范畴-概念林(群)-概念树-延伸概念的分野并未理清,统称概念节点。这就必然造成“同行优先”阐释的许多先天不足,从《理论》到《定理》 几乎没有任何改进。此后基本采取回避态度,很少提及这个短语。

先天不足的主要表现是:(1)未区分抽象概念和具体概念的同行;(2)未区分抽象概念三大范畴的的同行;(3)未区分两类概念节点(延伸概念与概念树及其上位的概念)的同行;(4)未区分串联与并联的同行。这四项“未区分”的性质有所不同,也许改换成如下的对应表述更为贴切。(1)要把具体概念的同行性从全部概念中独立出来;(2)要分别考察基元概念、基本概念和逻辑的同行性;(3)要分别考察延伸概念和非延伸概念的同行性;(4)要分别考察串联和并联的同行性。这就成为4项课题了。

对于这4项课题 这里可以作这样的概括:课题1已获得圆满解决[*03],另外的3项课题则依然有待探索,但笔者本人已无意于此。

提出“同行优先”的最初目标就是试图制定一系列无例外的规则。例如 同形态、同层级概念的相互邻接一定属于并联;同形态、不同层级概念的相互邻接一定属于串联;不同形态概念的相互邻接也一定属于串联。这3个“一定”乃是笔者最早抓到的一批“无例外规则”中的佼佼者,故倍感珍惜。语言信息处理学界一直流行着“语言规则必有例外”的说法,并很有蛊惑力,常使笔者感慨万千。所以 每抓到一个“一定”,就激发起一种贩卖的冲动。这种冲动是科学探索的大忌,“同行优先”说是HNC历程中最值得吸取教训的失败事例之一。在贩卖的时候 对于“同行性”仅具有概念树之上的粗浅认识,一旦进入到延伸概念的层次网络性世界 “同行性”的描述就过于笼统了,它既不适用于以本体论描述的延伸概念,更不适用于以认识论描述的延伸概念。不同形态、不同取值的“t”与“\k”概念可相互邻接,不同形态、不同取值的“o”与“eko”也可以相互邻接,但难以给出简明的串并规则。所以 《理论》之后 笔者很少使用“同行优先”这个短语。但该原则所体现的思路则在不断深化之中,具体成果就是“表:‘同行优先’原则促成的特定概念家族”所描述的有关内容。

本小节的回顾到此结束,至于期待 前文实际上已经暗示过了。那就是对前述“另外3项课题”的探索,这些探索的成果能够消解著名的乔姆斯基疑难[*04]么?未来的婴超应该可以给出一个令人满意的答案。

 

2.3.3 五元组各形态元素组合特征的内外之别。

五元组是抽象概念的形态元素,具体概念也有自己的形态元素,还有两可性的形态元素。三者的符号如下面的形态元素总表所示:

 

                  形态元素总表

 

类型             符号             汉语描述      英语表示

抽象概念         (v,g,u,z,r)      五元组          CF

                                  形态元素        CFe

挂靠概念         (w,p)            (物,人)

               (o) =: w//p        物与人的非分别说

物性概念           x

 

此总表没有什么新东西,只不过是为挂靠概念的符号w”和“p”合起来起了一个新名字:“物与人的非分别说”,符号化为(o),并把它们都纳入形态元素。但(o)毕竟与CF(五元组)有所不同,它不是纯粹的形态,也包含内容。把(CF,(o),x)集拢到一起就是一种灵巧性展现。

上面的叙述只关涉到CF内部的组合,这里把五元组当作形态世界的内部,把挂靠概念当作形态世界的外围。下面要回顾一下五元组与挂靠概念的外部组合问题了,这里为什么使用回顾这个词语呢?因为本小节提出的“内外之别”问题早已有了明确的答案,那就是“表:语言概念空间的第一基本景象”所展示的景象——(r(o),g(o),pw,(o,x))。五元组(v,g,u,z,r)里只有(r,g)两元素被赋予了对外组合的功能,(v,u,z)被排除在外,而且还把“r”排在“g”的前面。为什么要这么做呢?

    应该说 第二卷第八编的前两章已经对这个问题给出了十分明确的答案,但那里的答案还不够形而上。这里也不作正式的形而上论述,仅提供一个思考的途径。五元组里“r”是五元组的灵魂。“r”就是《老子》开宗明义所说的“名”(见第一章第一大句),那个与“道”对应的“名”,那个充当“道”之形态的“名”,那个“非常名”[*05]的名,即“名可名”所意指的可名之“名”。

 

结束语

本节正式提出了下列新概念或术语:内容世界和形态世界;主体形态世界和外围形态世界,前者也叫内部形态;世界形态世界的形态元素。

主体形态世界的形态元素为五元组(v,g,u,z,r)。

外围形态世界的形态元素为(w,p;x)。

两个形态世界内部各自存在自身的组合法则,两个形态世界之间存在另一种组合法则。

    HNC理论完成了形态元素的透齐性描述,但形态元素组合法则的描述还需要继续探索。

 

注释

[*01] 18种形态说只把gr”和“rg”排除在外了?为什么这两者被例外了呢?再没有别的了吗?这都是有趣的话题。这个话题与下文对HNC后来者的呼吁有密切联系。如果有一天能出现回应此话题的专文,那将是笔者最大的愉悦。

[*02] 这里关于汉语先天“缺陷”的“不可改变和不必改变”说是对汉语拼音化运动的简明总结。汉语拼音化运动是20世纪中华文明断裂历史过程的重大事件之一,该事件不是一个单纯的文化事件,也是20世纪中国苏维埃运动的一个重要组成部分。笔者对近代中国史的回顾文字都很有兴趣,但“汉语拼音化运动”的反思文字似乎特别少,论述所及 都不过是“蜻蜓点水”而已。

[*03] “圆满解决”说密切联系于挂靠概念的理论体系(见第二卷第八编),该理论体系引入了一系列的符号约定表示,其中符号“x”的相关约定尤为关键。

[*04] 乔姆斯基疑难是指“语法合法而语义荒唐”的“底层”疑难,即邻接词语之间展现出来的“合法不合义”疑难。乔氏曾给出过一个著名的示例,拷贝如下:“Colourless green ideas sleep furiously”。“合法不合义”疑难是否也会展现在语句层级?其展现形态如何描述?这个问题似乎还不明朗,所以 这里对“底层”加了引号。

[*05] 其原文是:“道可道,非常道;名可名,非常名。”对“常”的一种诠释是“永恒不变”。笔者不太认同这种诠释,而倾向于“常”就是“平常”的意思,与本《全书》经常提及的“形而下”相当,这样 可道之“道”和可名之“名”就与“形而上”相当。

 

 

          第三卷 第一编 第二章 4 五元组特定元素的强存在性

 

    本节的标题也许有点词不达意,因此 本节将采取最低级的自下而上撰写方式,从一个具体例子说起。具体例子将选择那比较容易理解的“z”强存在,避开那个不太好理解的“r”强存在。于是 本节3个小节的标题如下:

小节1:从“z”强存在的一个特例说起

小节2:五元组特定元素的强存在性有什么理论意义?

小节3:五元组特定元素的强存在性有什么技术价值?

 

2.4.1从“z”强存在的一个特例说起

    主体基元概念的概念树“增减34”是z”强存在的典型特例,其概念延伸结构表示式及部分内容拷贝如下:

          34:(m,3;~0α=b,3:(~4,e2m))

340           均衡

341           增加

342           减少

           3435           提高

           3436           降低

 

该概念树及所列举延伸概念的说明文字也拷贝如下:

增与减34、立与破35、推动、抑制与调节36构成第二个效应三角

这个三角分别与基本概念的量与范围j4、质与类j5、度j6强链式互关联,这就是说 增与减会导致量与范围的增减,反过来 量与范围的不足或过剩会导致增与减的需求;立与破会导致质与类的变化,反过来 质与类的固有缺陷或过时会导致立破的需求;推动与抑制会导致度的调整,反过来 度的失调会导致推动与抑制的需求

本子节引言中说到增减34与基本概念“量与范围j4”强链式互关联,但这不等于说增减34同“质与类j5”就没有关系。质必有量的表现,即质的值,因此增减34也会影响质。343m的设计就是为了反映这一基本世界知识。34m与343m的分工是:前者主要针对量j41,后者主要针对质j51

   

前两段文字描述了概念树34在彼山的定位要点,增减是第二个效应三角的一角,与基本概念的量与范围强链式关联。第三段文字描述了两项延伸概念在彼山的定位要点,增减的三级延伸概念343~0不仅直接关系到量与范围,也关系到质与类。这些定位描述暗含着一项“一竿子”思维不易觉察的信息:那就是形态元素“z”赫然居于主导或突出地位,而五元组的另外的4项则没有那么“赫然”,这在第三段文字里尤为明显。这“赫然”与否的差异是语言脑的一项重要世界知识,该项世界知识将凝练成这样一句话:z”强存在。这句话可以符号化么?这一特定的符号化表示很困难么?所谓的HNC历程 就是不断提出这类问题并加以解决的历程。

z”强存在意味着激活下述联想:数量短语必将出现在GBKC要素里,或是EK的QE//HE里[*01]。语言脑也许需要通过某种化学过程或物质以激活这项联想,但未来的婴超或语超并不需要,他们只需要一个关于z”强存在的符号表示就足够了。该符号表示将被赋予概念树34和延伸概念34m。当然 前者的加权因子应小于后者,那属于技术细节了。

于是 z”强存在的符号表示问题就变成了图灵机研究的万千窍门之一,这里是第一次使用窍门这个词语,今后将经常使用,请记住这一点吧。

本章2节的最后说过 五元组可进行不同类型两分或三分描述,并给出了基本角色和特殊角色的两分示例。这里 给出了一个z”强存在的示例,前两卷曾给出许多“r”强存在的示例,这些示例端倪着五元组的另一类两分或三分描述,建议名之存在性描述。存在性两分描述为:强存在与常规存在;存在性三分描述为:强存在、弱存在与常规存在。

这就是说 HNC建议 对五元组推行两种形态描述:角色描述和存在性描述。这是彼山景象的描述,请不要与此山景象直接挂钩,直接挂钩就属于“一竿子”思维。请注意 这里特意使用了直接二字,这意味着间接挂钩是允许的,那是灵巧性表现;而直接挂钩是不允许的,那是“一竿子”表现。

本小节以“说起”命名,到此说到了五元组形态世界描述的两项HNC建议,已经达到预期目的了。但上一段的最后几句话可能让读者很不习惯,下面写几句形而下话语吧。

HNC引入了广义对象语块GBK和特征语块EK的术语,GBK可以与主语和宾语间接挂钩,EK可以与谓语间接挂钩,但绝不能直接挂钩。因为HNC与传统语言学所使用的术语分别用于彼山和此山景象的描述,顶多存在大体对应的关系[*02]。在彼山视野里 广义作用与广义效应的巨大差异犹如陆地与海洋,广义作用句与广义效应句的GBK1有天壤之别。如果说把广义作用句的GBK1叫做主语还勉强得去的话,那么 把广义效应句的GBK1也叫做主语就荒唐可笑了。因为 广义效应句一定避开“主”(作用者),这是彼山的基本景象。如果没有彼山视野,当然不会明白这一基本景象,但总不能硬拉上一个先出现的家伙来冒充“主”吧!可有人就是这么干过,那是“一竿子”思维(一个完整的句子怎能没有主语!)作怪的典型呈现。还记得那“主席团坐台上,台上坐主席团”这两种效应句样式的著名主宾语之争么?提这些陈年旧事诚然显得很不厚道,但问题在于:对那场争论的本质出现过应有的反思么?那场争论是否充分暴露了西方语法学所铸造的此山视野存在着严重的局限性呢?而现代汉语学界是否对此一直缺乏真正的领悟呢?

 

2.4.2五元组特定元素的强存在性有什么理论意义?

本小节和下一小节可以合并成一个小节,为什么要分开?因为当下流行着一种奇特的思潮:没有技术价值的理论是半文不值的,理论意义必须附属于其技术价值。这里说的流行是一种半潜在的流行,不是见诸主流文字或主流话语的的流行,这是当下第二世界最具标志性的形态特色。

五元组符号是对彼山(概念世界)底层的形态描述,紧随其后的符号是彼山底层的内容描述。为表述之便 上文曾把前者叫做形态世界,把后者叫做内容世界。本《全书》对这两个世界的待遇似乎太过悬殊,对内容世界花费了两卷的庞大篇幅,对形态世界不过区区一章。如果有读者觉察到这个问题的存在,笔者将不胜欣慰。但笔者不认为这项待遇有失公平,因为这正是语言脑探索的特殊需求,形象脑和艺术脑就不能这么对待了,情感脑更不能如此[*03]。因为大脑进化历程最先出现的形象脑、情感脑和艺术脑(三脑)之形态世界可能比内容世界重要,语言脑反之,内容世界比形态世界重要,科技脑可能更是如此。当然 这都是假说,但是 大脑奥秘的探索需要这一类的假说,灵巧思维离不开睿智的假说。HNC之所以建议大脑奥秘的探索要以语言脑为突破口(见本卷卷首语引言) 其基本缘由就在于此了。

本章所描述的形态世界乃是语言脑的底层形态,随后的三编还会涉及到中层和高层形态的描述。语言脑底层形态的核心课题是什么?“五元组特定元素的强存在性”有充当核心的资格么,这是萦绕在笔者心中十多年的困扰。围绕着这个困扰的思考最终能出现菩提树下的顿悟么?本小节要告诉读者的只是:提出并思考这个问题是重要的,而答案并不重要。

 

2.4.3五元组特定元素的强存在性有什么技术价值?

2004年以后的7年多来 笔者在不断呼吁 向各级延伸概念捆绑各种代表性语言的词语或短语才是语言知识库建设的重中之重,近年 各种代表性语言的说法已被“三位代表”(英语、汉语和阿拉伯语)所替代。这项呼吁的内容之一就包括本小节所提出的问题。

这里说的技术价值有表层与深层之分,表层技术价值是指对于降伏三大劲敌和扫荡15支流寇的价值,深层价值指对于HNC三大战役的价值。两层级技术价值不是截然分离的,表层技术价值是深层技术价值的开路先锋。

本节为底层形态世界提供了两种描述方式,一是角色描述,二是存在性描述。角色描述有基本与特殊之分;存在性描述有强弱之分。

HNC视野里 这两种描述方式之表层技术价值的探索乃是典型的“大急”性课题,可是 该课题还是一片待开垦的处女地。

本小节只提出问题,没有答案,读者可以理解吧。

 

小结

    请回顾一下彼山第一基本景象之说吧,每一彼山基本景象都存在内容世界和形态世界的基本区分,本章是对第一彼山基本景象形态世界的简要描述,请记住这一点吧。

 

注释

[*01] 符号QE和HE可能是本《全书》第一次使用,其意义尚未说明,将安排在本卷的第二编,没有读过《理论》或《导论》的读者不妨试猜一下。这两个符号曾考虑过在概念树“特征块复合构成l63”里引入,后来放弃了。

[*02] 这个大体对应关系的说明见“主块标记l0”章([240-0])的引言,那里罕见地给出了一张图,名之“图:(E,A,B,C)与‘主谓宾’的对应”。

[*03] 情感脑的形态世界远比内容世界重要的证据太多了,汉语的“英雄难过美人关”和“一见钟情”两小句也许是最生动不过、也最有说服力的两项证据。

[*04] HNC三大战役曾有过两种描述方式,一是赤壁之战、图灵之战和垓下之战;二是机译之战、婴(微)超之战和语超之战。第一种描述方式虽然外表显得不伦不类,但具有内在惟妙惟肖的特质。三大战役的设想已出现在《定理》里,正式提出见本《全书》的附录3:《把文字数据变成文字记忆》,那时还没有引入婴超这个术语,该战役被命名为“智力培育战役”。

 

 

 

第三卷 第一编 第三章 概念树

 

引言

HNC提出的众多术语里 没有什么术语属于比概念树更平凡,但也什么术语的命运比它更为坎坷。平凡与坎坷本来不应该存在什么必然联系,但概念树的平凡与坎坷不同,简直就是一种宿命。

出现这种奇异状况的原因就在于HNC探索之初正值句法树热的时期,当时句法树的显赫地位与其说是让笔者迷惑,不如说是让笔者震惊。该震惊诱发出一种抵触心理或潜意识,那就是想尽力避开那个“树”字。但树毕竟是植物世界之王,树的概念是分类学的基础,怎能回避又何必回避呢?所以 在《定理》里终于出现了概念树的术语。但那里的概念树并不是后来的正式命名的概念树,而是概念林(群),《定理》里把概念树叫做根概念。

概念树概念形成过程的坎坷经历造成了HNC相关文献(包括专著和大量博士论文)对概念树及其上下位术语使用的混乱,笔者是这些混乱的祸首,这里深致歉意。

上章引言里说:“就第一基本景象来说 底层景象即五元组;中层景象即概念树和概念延伸结构表示式;”所以 本章和下章都是对概念基元世界中层景象的描述。

概念树同样有内容世界和形态世界的区分,本章将依据这一区分而划分出两节,其标题是:(1)概念内容世界回顾;(2)概念树形态世界素描。这两个标题分别使用了回顾和素描的词语,因为前者已有足够的描述,而后者则尚未予涉及,而本章也不拟详说。

    本章和下章都是对“表:语言概念空间的第一基本景象”的进一步诠释,两者皆以概念树为参照,本章作上行思考,下章作下行思考。

 

 

            第三卷 第一编 第三章 第1节 概念树内容世界回顾

 

前两卷共计456节,每节对应1株概念树,共计456株概念树,这是概念树内容世界的数字全貌。这个数字有一定意义,但这个数字与联合国有19m个成员的数字类似,只是一个数字而已,对于联合国全貌的理解没有多大意义。

怎样才能理解联合国的全貌?专家们可以给出许多专家视野的完整答案。但这里要说一句话 专家答案可能缺乏一项最重要的世界知识,那就是联合国的成员分别来于地球村的六个世界。六个世界代表着不同国家的文明身份,文明身份才是联合国构成的内在或核心要素,但这项要素依然处于被严重忽视的奇特态势。

联合国成立于工业时代的末日,联合国的缔造者们未能看到后工业时代的历史曙光不足为怪,虽然联合国的主要缔造者小罗斯福先生当年多少有那么一点曙光的感觉。现在 66年过去了,后工业时代的曙光已经比较清晰了,该曙光最耀眼的标志就是六个世界的赫然呈现。可是 这赫然的曙光却被许许多多政治、经济和文化标签所笼罩和掩盖。第一世界的智者依然被所谓的普世价值所陶醉,另外五个世界的智者则被各种历史的和现实的阴霾所遮蔽,都像大清帝国的康、雍、乾三位很有作为的皇帝一样 未能及时觉察到新时代曙光的赫然呈现。因此可以说 上述奇特态势的出现乃是文明意义下的历史再现。

概念树的内容世界与联合国有类似之处,那么 概念树的什么东西大体对应于联合国成员的文明身份呢?那就是概念范畴。文明身份有六大类,概念范畴有五大类,这个类比似乎很勉强,其实很深刻。此话很唐突么,未必!请看下文。

六个世界主要是对地球村的内容描述,而不仅仅是地理描述;五大概念范畴是对语言脑的内容描述,而不是几何形态的描述。此其一。

六个世界存在过三种文明标杆,五大概念范畴也存在对应的东西,那就是抽象概念、具体概念和两可概念的三分。此其二。

六个世界的每一世界都拥有自己的成片地域,五大概念范畴在大脑皮层里的分布也理应如此[*02]。此其三。

每一世界内部存在不同类型的复杂构成,但也呈现出极度繁杂(如第三世界)和十分简明(如第五世界)的两端型差异;每一概念范畴内部也是如此,有极度繁杂的基元概念,也有十分简明的基本概念。此其四。

每一世界的内部存在众多的国家集团和国家,每一概念范畴也是如此,国家集团对应于概念子范畴或概念林,国家对应于概念树。此其五。

每一世界、每一国家集团内部往往[*03]存在主从之分,每一概念子范畴和概念林也是如此。不过笔者给后者的主与从另外起了一对名字,叫共相与殊相。此其六。

现代国家曾出现过章鱼型的巨怪,典型的庞然大物有工业时代的大英帝国[*04]、一度无比辉煌的苏联[*05]和长盛不衰的美国[*06],概念树也有类似的巨怪,典型的庞然大物有“‘心理’行为7301”、“意志行为7302”、“现实行为7331”、“个人行为7332”和“简明挂靠概念(o,x)”等。此其七。

国家类型或社会制度有民主与专制的简易两分,概念树的类型或“制度”也有抽象与具体的简易两分。此其八。

    以上八点 就是本回顾的八个要点,细节问题就略而不述了。八要点的最后一点大约最令人厌恶,但笔者却对它抱有偏爱,因而写了为专制“辩护”的大量文字,集中的阐释在“个人行为7332”这株概念树里,请参阅。

在《全书》的撰写过程中 国家和概念树这两个概念经常同时浮现在笔者的脑际。如果可以说“一个概念就是一个世界”,那么也就可以说“一株概念树就是一个国家”,地球村的国家是有限的,语言脑的概念树也是有限的,这一有限性的探索也许是或应该是21世纪最有价值的科学探索难题,不比粒子世界或宇宙的探索(两者的探索正在走向融为一体的宏伟态势)轻松多少,但更有价值。回顾总希望讲几句概括性的话语,上面的大句就是本回顾最希望说出来的话语了。

以上话语是对“概念无限而概念基元有限”的一个比喻式诠释,不过 作为比喻 它只是一半,另一半在下一章里。

 

注释

[*01] 六个世界的系统论述见第二卷第八编第二章第2节里的“‘六个世界pj01*\k=6’综述”([280-2213])。

[*02] 见

[*03] 这里的“往往”等同于“准必然”,故特意使用了黑体。

[*04] 大英帝国的残骸现在还保留着一个叫有名无实的名称,叫英联邦。英国本身也还保留着两条著名的章鱼腿,即马尔维纳斯群岛和直布罗陀,此外 她还在印度洋和大西洋保留不少小章鱼腿,印度洋的小腿还颇具战略意义。

[*05] 章鱼的形象似乎不适合于苏联,这就不能不说一声1960-1970年代发生于印尼(第四世界)刚果(第五世界)和智利(第六世界)的重大政治事件了,该三大政治事件都跟以苏联为首的社会主义阵营脱不开干系,本《全书》曾在[]里提到过。当下的俄罗斯是否还保有章鱼情结呢?它对日本北方四岛的强硬态度不就为这个问题提供了明确答案么!

[*6] 在人类历史的国家大章鱼群里 美国的罪恶勾当不属于大巫,有人喜欢把大巫的帽子扣在他的头上,有失公允,因为它确实为现代社会的发展和进步做了大量好事。也许小巫的帽子比较合适吧,但这个小巫得天独厚,其“天时、地利、人和”三要素可谓空前绝后,是上帝的第一号宠儿。夏威夷、阿拉斯加、中途岛、关岛等等都是最让人羡慕的章鱼腿。

 

 

            第三卷 第一编 第三章 第2节 概念树形态世界素描

 

前一节的内容了无新意,那是回顾的本色。本节应该有所不同吧,虽然素描是HNC的惯用词语,但形态世界的说法 似乎是刚刚出现啊。

本节想说的第一句话就是:请不要如此想。因为 形态世界与内容世界是不可能截然分开的,两者需要分别说,更需要非分别说。在一定条件下 可以说形态决定内容,也可以说内容决定形态,这个说法有点类似于第一名言和第二名言[*01],都属于点说或分别说,而不是体说或非分别说[*02]。本节为行文之便 将经常使用点说方式,这是需要交代一声的。

上节的章鱼比喻就关涉到形态了,国家比喻其实也涉及到形态。本节的形态素描更适合于采用比喻手法,将不仅把概念树比作国家,也比作树木。

现代地理对一个国家的描述包括14项要素,下面把这14项要素重新排列组合,分为3组:(1)自然、民族、历史;(2)国名、首都、国庆、政区、经济、货币、语言、集锦;(3)面积、人口、宗教。第一组与概念树对应,包括形态世界和内容世界;第二组则与下一章的概念延伸结构表示式(延伸概念群)[*03]对应,该组的8项要素是文明主体三要素的概略描述,前4项对应于政治,中间两项对应于经济,后两项对应于文化;第三组的3项则与概念树及其延伸概念群两者都有联系,或者说是两者的综合呈现。本节主要涉及第一组要素,也旁及第三组。

自然决定民族,民族决定历史。六个世界都各有其自身的“自然、民族、历史”渊源,每个国家同样如此;概念范畴也有其自身的“自然、民族、历史”渊源,概念树也是如此。这个话题太大,然而是本节论述的基础。下面以4个小节进行点说,目次如下:

小节1:六个世界的形态素描

小节2:概念范畴的形态比喻

小节3:概念林的形态比喻

小节4:概念树的形态比喻

 

3.2.1 六个世界的形态素描

    本小节的内容看似一个多余的东西,它在“‘六个世界pj01*\k=6’综述”里已有所论述,这里也是一个回顾,但有所补充,试图对六个世界给出一个更清晰和更简明的素描,目的在于为随后各小节的论述提供一些便利或做一点铺垫。

第一世界有三大板块和一块飞地,第一板块在西欧,第二板块在北美,第三板块在大洋州,后两大板块都仅各有两个国家。那块飞地叫以色列,在亚洲的最西端,成为第四世界主体的一根“在背芒刺”。

第一世界的第一板块是整个第一世界的祖宗,将名之祖宗板块1。大体上可以说 第二到第五世界跟这个祖宗没有什么血缘关系。这位祖宗的“面积和人口”很平常,HNC曾戏称之“撮尔西欧”,但她很了不起,创建了现代文明。为什么她会赢得如此辉煌的历史业绩呢?专家的论述可谓汗牛充栋,但似乎缺乏一个合适的素描。这里要提供一个,那就是:历史上她虽然也曾出现过秦始皇的身影,但不曾出现也不可能出现一个大一统的秦汉帝国。这是一个特定的“无”,叫大一统帝国的“无”,为祖宗板块1所特有。

这个特定的“无”与祖宗板块1的辉煌有什么联系呢?答案是:那“无”恰恰是那辉煌最重要的缘起。那么 这个“无”之缘起又是什么?答案是:一个特定的“有”,那就是祖宗板块1的“自然、民族、历史”独特性。此两缘起说岂非与“天地万物生于有,有生于无”(《老子》第四十章)的著名论断相左么?非也!因为《老子》第二章还有“有无相生,难易相成,…”的基础性论断。

“祖宗板块1”之自然独特性决定了其独特的民族多样性,而其独特的民族多样性又决定了其特定之“无”的历史独特性。这一历史独特性似乎一直为专家视野所忽视,没有把人类文明革命进程清单[*04]里的八大事件与该历史独特性联系起来加以考察。大一统帝国之“无”是“祖宗板块1”的基本特色和独特优势,基督教对这一特色和优势之形成所起的历史作用是一个非常有趣的课题,但似乎也在不同程度上遭到专家视野的忽视。

但是 第一世界的龙头老大早已离开“祖宗板块1”了,现在的老大是其北美板块的美国,这位老大虽然很年轻,但已形成自身的“自然、民族、历史”特色,其“面积和人口”也充分满足一个现代帝国的需求。

第二世界只有一个板块,目前也有一块飞地。该板块也有一位祖宗,将名之“祖宗板块2”,即延续秦汉帝国的中华帝国。她与“祖宗板块1”有什么显著差异呢?请看下表:

 

              表:三祖宗板块的基本特征

 

    名称              主导民族    主导宗教    大一统帝国

    祖宗板块1           无*         有**        无***

    祖宗板块2           有***       无***       有***

    祖宗板块3           有*         有***       有*

 

    此表揭示了如下的世界知识:(1)祖宗板块1不能继续充当第一世界龙头老大的地位,她必须让位于美国,这是由其主导民族之“无*”和大一统帝国之“无***”这两项要素所决定的;(2)祖宗板块2有条件再次充当第二世界的龙头老大,这是由其主导民族之“有***”和大一统帝国之“有***”这两项要素所决定的,但她存在一项根本缺陷,那就是主导宗教之“无***”,此项缺陷原本并不存在,是一个世纪以来中国式断裂的产物,此项弥补工作非常艰巨;(3)祖宗板块3有自身的强项,即主导宗教的“有***”,但主导民族和大一统帝国的“有*”是她的致命弱点,很难再出现一个第四世界的龙头老大,下文会有进一步的说明。

第三世界也有三大板块,但无祖宗板块。每一板块各有自身的主导民族、主导宗教和主导国家,但没有一个公认的祖宗。在地理上 第三世界的北、东、南三大板块与第二世界的北、东、南三面邻接,第四世界主体板块的东部分支区块与第二世界的西部邻接。

第四世界拥有“祖宗板块3”,现有两大板块:主体板块和东亚板块;有一个强存在的主导宗教;主体板块内 曾经出现过主导民族和大一统帝国,现在四分五裂,有7个分支区块。

第五和第六世界都只有一个大板块,一个邻居。没有主导民族,没有祖宗板块,更没有飞地。第五世界没有主导宗教,其整个北部地区继续受到伊斯兰教的强势渗入。第六世界存在主导宗教——天主教,但其影响力远不如第四世界的主导宗教——伊斯兰教。第五世界可粗分5个分支区块,第六世界可粗分4个分支区块。

六个世界的地缘特征如下表所示:

 

          表:六个世界的地缘特征

 

    名称            邻居

    第一世界        第三世界北板块、第四世界、第六世界

    第二世界        第三世界北、东、南三个板块、

第四世界主体板块的东部分支区块

    第三世界        第一世界祖宗板块、第二世界、第四世界

    第四世界        第一世界的祖宗板块和大洋州板块、第二、第三、第五世界

    第五世界        第四世界主体板块西部的三个分支区块

    第六世界        第一世界北美板块

 

上面 仅叙述了六个世界之“自然、民族、历史”的形态要点。下面对其内容要点作8点概括或补充:

1)历史上 六个世界的邻居之间都发生过战争,其中 最持久、最有决定性意义的战争是第一世界与第四世界的两个祖宗板块之间的战争。从疆域的占有来说 这场历经千余年的战争最终以平手告终。

    (2)历史上 祖宗板块1内部曾发生过无休止的民族战争,该板块还是20世纪两次世界大战的策源地。但现在 在该板块内部和整个第一世界内部 战争的阴霾已彻底消散。

    (3)在近代 祖宗板块1曾向全世界发起过远征,抢占了两大“空旷”[*05]板块,催生了第六世界,但现在 曾被他们占领或控制的第二、第三、第四和第五世界的地盘都已经“物归原主”[*06]。

    (4)在近代 祖宗板块2(中国)曾遭到第三世界两个主导国家的严重伤害。中国的这两位邻居是工业时代列车的最后两名乘客,两位都充分表现了后来者的特有疯狂,所采取的强盗手段都达到了残酷之最和怪异之尤的程度。对中国来说 与两位邻居的两笔近代史旧帐都不堪回首。但一笔已彻底注销,另一笔则残留着一条似小而大的麻烦尾巴。中国与第一世界的历史旧账似乎已经注销,但实际上也残留着一条最麻烦的尾巴。此外 中国与第三世界东方板块的两位小邻居和南方板块的一位大邻居都存在地缘利益[*07]纠纷。两条尾巴和三项纠纷在工业时代的视野里都是死结,但是 对这一死结的深入思考或许会诱发出一种符合后工业时代召唤和传统中华文明理念的战略智慧。第二世界与第一世界远隔万里之遥,无地缘利益的直接冲突,上世纪在这两个世界之间发生过两场惨烈的战争,但对中国和美国双方来说 都可以当作“往事如烟”来处理了。

    (5)第三世界北方板块的内部构成最为复杂和微妙,她有一个主导宗教(东正教),也有一个主导民族(斯拉夫民族),但两者并未形成有效的文明凝聚力。该板块的主导国家——俄罗斯——曾充当社会主义阵营的龙头老大,该阵营的西线溃散之后 俄罗斯的龙头老大情结依然浓重存在,正在向鹰民主政治制度演变,该演变的示范作用不容忽视,也有助于弥补俄罗斯在其龙头老大情结与人口颓势之间的巨大落差。

    (6)祖宗板块3的现状最为特殊,主体民族(阿拉伯人)内部两大教派(逊尼派和什叶派)之间的复杂纠结基本上还停留在农业时代的思维习惯里,许多国家的内部纠结也基本如此。基地组织发动的“圣战”虽然已经日薄西山,但高举霍梅尼革命和塔里班革命旗帜的族群并不属于祖宗板块3的主体民族,其号召力不容忽视,这是一场加强教帅地位与作用的革命,其潜在或长远影响似乎被西方主流学派所低估。祖宗板块3里有一个人数众多、地域广阔的突厥区块,但其样板国家——土耳其——偏居该板块的西北隅,难以发挥示范效应。至于所谓的“阿拉伯之春” 绝不是西方人所喜爱或想象的那种政治制度革命,而是伊斯兰特色的政治制度革命,主要是针对变相君主制的革命。第四世界的选票一定是典型的认同型选票,而不可能是第一世界的自主型选票[*08]。总之 祖宗板块3依然是、并将继续是一盘散沙,不可能形成具有全球影响力的龙头老大。

7)六个世界的地缘形态将长期存在,但具有全球影响大的龙头老大(将名之现代帝国)不会也有相应的六个,目前只有一个,那就是美国,可能再出现另一个,那就是正在崛起的中国。足够的面积和人口是现代帝国的必要条件,因此 试图争当现代帝国的俄罗斯只能落得个“一相情愿”,它最有希望的前景不过是充当第三世界北方板块(可另名斯拉夫世界或东正教世界)的龙头老大。第三世界的南方板块也很可能出现一个地区龙头老大,那就是印度。但印度绝不可能成为环印度洋地区的超级龙头老大,更不用说成为现代帝国了。印度的人口规模符合现代帝国的条件,但它的“自然、民族、历史”(包括面积)条件却远远不够,有些专家仅拿GDP或军事力量来说事 那是过于形而下了。第六世界可能出现一个地区龙头老大,那就是巴西;但第五世界不可能出现地区龙头老大;东南亚地区、东北亚地区、中亚地区、加勒比地区、中美洲地区、阿拉伯世界、突厥世界、撒哈拉以南的伊斯兰世界也将都是如此。这些地区或世界会出现另类“欧盟”么?有可能。但应该看到 由祖宗板块1演变出来的欧盟尚且只能充当一个现代帝国平等伴侣的角色,而不可能成为另一个现代帝国,何况其他类型的“欧盟”呢?

8)六个世界已经是人类家园的一个赫然存在,每个世界都拥有自己的“自然、民族、历史”独特性,正是这一独特性决定了各自的赫然存在。联系于全球化的多元化宏论仅涉及人类家园的表象,六个世界的深入文明阐释才触及人类家园的本质。六个世界的赫然存在就标志着后工业时代的来临,它就是后工业时代的曙光。但遗憾的是 人类习以为常的形而下历史记忆容易遮蔽人类的时代视觉,围绕各种利益(特别是国家利益)之争而不断涌现的各种重大事件容易搅乱人类的时代思考。工业时代的云雾依然极度浓重,一方面是萨达姆先生的疯狂、霍梅尼先生的号召、科索沃战争的诡异、小布什先生的莽撞、美国重返亚洲的鼓噪…,另一方面是各路领域专家在工业时代柏拉图洞穴里编制出来的无数理论与学说。这样 一个已然清晰的新时代曙光却被浓重的旧时代云雾所遮掩。康熙皇帝和彼得大帝同时为两个大帝国引路,结局有天壤之别!何以故?非智力之差距也,乃时代视野的差异也。若论“以史为鉴” 没有比这个更宝贵的东西了。

 

本小节引入了祖宗板块、地区板块、分支区块、现代帝国、地区龙头老大等比喻术语,下面会加以引用。

 

3.2.2 概念范畴的的形态比喻

本小节和随后的两小节都将大量使用比喻语言。

本《全书》用六个世界来描述人类家园,用五大概念范畴来描述语言概念空间。比喻的前提是存在某种对应性,可是 这“六”与“五”如何对应呢?将某一特定世界与某一特定概念范畴直接对应显然是不可取的,但是 每一世界都存在复杂的内部构成(子世界),每一概念范畴也有复杂的内部构成(子范畴),从子世界和子范畴的视野看 就是另外一番景象了,特定子世界与特定子范畴的对应不仅是允许的,甚至具有一定的启示意义。

在六个世界的论述里 曾大力突出祖宗板块1和一个现代帝国——美国——对人类家园的历史性贡献;在语言概念空间的论述里 曾大力突出主体基元概念和第二类劳动这两个子范畴在语言脑里的特殊地位。那么 下面的对应关系

主体基元概念 := 祖宗板块1

第二类劳动 := 美帝国

是否成立?请思考。

在三类精神生活的论述里 详尽描述了第一类精神生活,努力探讨了深层第三类精神生活,特意赋予了第二类精神生活一项奇怪的“特权”——记忆的拥有者。在三个历史时代的论述里 反复强调了第二世界的未来历史价值,为什么这样处理呢?请看下面的对应性思考(以强交式关联表示)。

          第一类精神生活 = 第一世界

          深层第二类精神生活 = 第四世界

          深层第三类精神生活 = 第二世界

   

第一世界的合理存在性不仅有其光辉业绩的印证,而且有现代人文社会学的系统理论依据。但其异议之声依然不可忽视,马克思答案曾异议于前,霍梅尼旗帜又异议于后,列斯毛专利的追随者并未消失。第四世界之合理存在性未出现过系统的理论质疑,这很有趣,但不乏窃窃私语者。第二世界之合理存在性的异议之声最强,因为新老国际者都对第二世界的现状感到绝望。但第二世界抓住了全球经济格局大转折的千载难逢机遇,在改革与开放的旗帜下 创造了世界经济发展史上最辉煌的一页。不过应该指出 那面旗帜本身只是一种加强第二世界力量的方略,并不是第二世界之合理存在性的理论依据。那么 该理论依据是否存在?从那里去寻找?本“全书”为此尽力提供了一些素材,实际上 海内外华人的文化探索者们已经作出了许多重要贡献,这涉及人文社会学的最高学科领域[*09],王康先生[*10]是该领域一位难能可贵的专家。

概念范畴的形态比喻就举这两个例子。在五大概念范畴里 挂靠概念是最特殊的一个,曾打算在本小节大事比喻一番,现决定后移到下一章。

 

3.2.3 概念林的形态比喻

    概念林有共相与殊相之别,共相概念林拥有一个最神似的形态比喻,那就是地区龙头老大。不是每一世界和每一地区都必然存在地区老大,概念林也是如此。但是 不存在共相林的概念子范畴是少数,而不存在地区龙头老大的世界和地区却是多数。这似乎表明 语言概念空间比当前的人类家园更协调,后者应该向前者看齐,从而走出后工业时代的初级阶段。这话请别见笑,那正是笔者对人类家园未来的憧憬。

 

3.2.4 概念树的形态比喻

概念树也有共相与殊相之别,因此 概念林的形态比喻可以完全移用于概念树。不过 对上一小节的论述需要作两点改动和一点补充。

两点改动是:(1)龙头老大的级别需要下调,其修饰语要从“地区”改成“分支”。(2)上述看齐问题不再那么重要,因为分支区块的各成员应该享有更大的自主权:保持自身特色的自主权。如祖宗板块1里瑞士的中立权、第三世界南方板块里不丹王国的环境权。

一点补充是:概念树可比喻为国家,这个比喻十分传神,也是对上面第二项改动的绝妙诠释。但这个补充实际上是重复,上一节已说过不只一次了。下面将回应一下“不仅把概念树比作国家,也比作树木”的说法。

树木形态最显著的差异是乔木与灌木,概念树也是如此。乔木里有参天大树,概念树也有,上一节列举了不少参天概念树的例子。这里要补充两点:(1)“‘心理’行为7301”乃是概念树的参天之王,(2)“个人行为7332”乃是概念树的参天之神,所以 本《全书》为这两株抽象概念树写下了最多的文字,为“人文社会学最高学科领域”及其“素材”进行了力所能及的系统说明。这个重大话题今后不再涉及了,这里就便给出最后一说:最高者 三个历史时代、六个世界、三种文明标杆之文明总描述也,全球化者 化不掉也不应该化掉此“三、六、三”之本质差异也,此本质差异之健康存在关乎人类家园之拯救也;不思考、不理会此根本势态者 非工业时代柏拉图洞穴里之刁民(金帅、官帅、教帅及其追随者),即该洞穴之顺民(需求外经信奉者和新老国际主义者)也。

    回到乔木与灌木的小话题。乔木与灌木都有长青与落叶之别,概念树亦然。主体基元概念和基本概念的概念树一律常青,但语法逻辑和语习逻辑的概念树则一律属于落叶。常青者 不随时空而变化也,落叶者 随时空而变化也。其它范畴之概念树 则两者兼而有之。

如何区别概念树之乔木与灌木呢?延伸概念多于一级者为乔木,仅延伸一级而封闭者为灌木。可以预期的是 灌木概念树主要存在于语法逻辑和语习惯逻辑,可能出乎意外的是 语言概念基元之母——基本逻辑概念——竟然也是灌木。

 

小结

    本章对概念树的内容世界作了一个全方位的回顾,对概念树的形态世界作了一个国画式的素描。回顾有8个要点,素描也有8个要点。这里使用了不少HNC术语,绝大部分未加注释,请读者谅之。

 

注释

[*01] 第一名言指“存在决定意识”,第二名言指“意识决定存在”。在本《全书》第一卷第二编有过多次论述。

[*02] 这里以“叩其两端”的方式将“点说-线说-面说-体说”简约为“点说”与“体说”,并将点说对应于分别说,将体说对应于非分别说。分别说以分析为主导,非分别说以综合为主导,这是牟宗三先生喜好使用的两个术语。在20世纪的新儒家中 牟先生是最能在不利社会环境下潜下心来做学问的大家,是最能抗拒金帅、官帅和教帅忽悠神力的大家,是最接近于融会中西、贯通古今的大家,所以笔者在本《全书》里选用了牟先生喜好的两个词语,以表示敬意。

[*03] 这里是第一次使用延伸概念群这个词语,以后将经常用它来替代概念延伸结构表示式。但这个“群”字一定不要加在每级延伸概念前面,虽然每一级延伸概念也可能是一群,并同样具有封闭与开放的基本特性。

[*04] 该清单的简略说明见“行为与理念7321”节的“理念行为73219的世界知识”分节([123-21-1])。

[*05] “空旷”者 无成熟的国家形态了,为表示对原土著居民的同情和尊重,“空旷”二字加了引号。

[*06] “物归原主”是20世纪的大事件之一,正式名称是民族解放运动。“物归原主”说不过是取起比较形象而已,丝毫没有为以色列这块“小飞地”辩护的意思

[*07] 这里使用了“地缘利益”的词语,这是一个工业时代视野应予严厉谴责的词语,然而它是一个后工业时代视野里的明智词语。

[*08] “三类型选票”的论述见概念树“个人行为7332”里的“个人理性行为7332\2的世界知识”小节([123-322])。

[*09] 关于“人文社会学的最高学科领域”的设想和命名见…

[*10] 这里特意提到王康先生,因为他的思考方式和人生历程都非常独特,因而很有希望走出工业时代的柏拉图洞穴。

 

 

第三卷 第一编 第四章 概念延伸结构表示式

 

引言

本章涉及“概念无限而概念基元有限”这一论断或公理的下行思考,该项思考的要点在总论(本编第一章)里已经描述过了,现拷贝如下:

延伸概念的纵横结构都是有限的,纵向延伸的边界触及专家知识,横向延伸的边界触及生理脑和大脑之另4项构成(图象脑、情感脑、艺术脑和科技脑)的相关知识。诚然 这两大边界也许是一个巨大的模糊地带,那就让它们继续存在吧,不进入或适度进入该模糊地带就是HNC的基本对策。如果说 语言脑概念范畴的有限性是概念基元有限性这一论断的必要性保证,那么 不进入或适度进入的基本对策就成了该论断的充分性保证

基于上述要点 本章将设置下列4节:

1:概念延伸结构表示式简介

2:横向延伸的齐备性探求

3:纵向延伸的透彻性探求

4:挂靠的哲理描述

 

    本章各节的标题比较特别,但昭示了一个明显的格局:节1将以简介为名,行全包之实,因为 后3节都偏于形而上,惟有节1独当形而下。

 

 

          第三卷 第一编 第四章 第1节 概念延伸结构表示式简介

 

本简介不同寻常,将包括一些超出简介内容的文字。分4个小节,后两者的命名比较特别,那里将首次出现一些“强探索性”文字。

4小节的目次如下:

小节1:概念延伸结构表示式的历史回顾

小节2:概念延伸结构表示式的符号说明

小节3:概念延伸结构表示式的玄机

小节4:延伸概念的玄机

 

4.1.1概念延伸结构表示式的历史回顾

概念延伸结构表示式的定义式如下:

      (HNC1) ::= (CT:(OD//ED)|;)

这个定义式叫做抽象概念的数学表示式或语言概念的数学表示式,相应的汉语表述是:语言概念数学表示式定义为概念树逐级后挂一系列的本体论描述(OD)或认识论描述(ED)。此表述里的“概念树”以符号“CT”表示;逐级以符号“;”表示;“后挂”以符号“:(…)”表示;“一系列”以符号“|”表示。

这个表示式起源于对抽象概念的探索,《理论》里曾说过:“一般来说,具体概念的精确表达要比抽象概念困难得多,但另一方面,人在理解过程中对具体概念的认识深度可以比抽象概念浅得多,天生的盲人仍能同常人一样掌握自然语言,道理就在这里。”(《理论》p41)

本体论描述OD的全名是延伸概念的本体论描述,也叫语言理解基因的第一类氨基酸;认识论描述ED的全名是延伸概念的认识论描述,也叫语言理解基因的第二类氨基酸。这些术语前文有预说,见“誓愿行为(537301\21)的世界知识”([123-01215]孙节)。

概念树CT、本体论描述OD和认识论描述ED各拥有自己的一整套约定符号系统,每一个约定符号都被赋予特定意义。这是一项浩大的理论工程,走了许多弯路,但可以告慰于读者的是:其基本成果已记录在本《全书》的前两卷里了。

如果对(HNC1)里的CT、OD和ED以约定符号进行替换,则该数学表示式就变成了物理表示式(HNC-1),该物理表示式被正式命名为概念延伸结构表示式。

该命名首见于《定理》的p18,是HNC探索历程中的一件大事,惜笔者当时未给予足够的强调,这是一个不小的遗憾。《理论》阶段引入的许多不合适术语继续被使用,HNC理论阐释出现过诸多混乱,与这项遗憾是脱不了干系的。

在那里 给出了“政治治理与管理(治国)a12”的示例,修改后[*01]的形态如下:

a12:(t=a,3,7,\k=2,;9t=a,ae2m,3eam,7m,;)——[a12-0*0*;][*01]

下面 将本《全书》给出的结果拷贝如下,以资比较。

a12:(t=a,3,i,\k=3,7;

                 9t=a,ae2m,3:(e2m,eam,n),i:(n,e2m),\1*t=a,\2:(e2m,*t=a),\3k=5;

                 3e2m:(e1n,3,i,e7n),3ea1d01,3ea2c01,3(n):(e2n,7),

                 in3,ie2me4m,\1*te2n,^(y\2*9);

 3e2mit=b)——[a12-0000][*01]

 

两个概念延伸结构表示式被分别赋予了编号[a12-0*0*;]和[a12-0000],两者都会让人眼花缭乱,但在HNC的数字世界里 应该完全是另外一番景象,不是缭乱,而是极度清晰,可以在“a12”这个特定的“绝顶”上 领会一下“一览众山小”的境界(即王国维先生所说的第三境界)。未来的语超可以依赖这个表示式而达到那个境界么?但笔者宁愿反过来问:有了这样一幅数字图象 未来的语超还有什么障碍或理由不能达到那个境界呢?这属于本卷第八编的话题,这里只是一次插写性的预说。

两个表示式的缭乱性表面上差异很大,但如果稍稍习惯一下表示式里的符号基元[*01],那“缭乱性”就会趋于消失,而呈现出一幅“大同小异”的清晰景象,可归纳成下列两点:

1)《定理》里的“a12:(t=a,3,7,\k=2;”

变成了《全书》里的

          “a12:(t=a,3,i,\k=3,7;”,

此项变化意味着[a12-0*0*]和[a12-0000]的一级延伸概念无实质性变化,不过出现了两项符号替代和一项符号增添:以“i”替代“7”;以“\k=3”替代“\k=2”;增添了一个“7”,但该增添“没有下文”,其含义在下文说明。

2)《定理》里的

          “;9t=a,ae2m,3eam,7m”

变成了《全书》里的

          “;9t=a,ae2m,3:(e2m,eam,n),i:(n,e2m),\1*t=a,\2:(e2m,*t=a),\3k=5”。

此项变化意味着《定理》的全部二级延伸概念都完整地保留在《全书》里,只不过把“7m”换成了“in”,增添的东西后面再说。

上面是对“概念树a12”之概念延伸结构表示式的过程叙述,这样的叙述多半会让读者感到厌烦,那所为何来?一是为了说明每一个概念基元物理表示式(即延伸概念)的确定来之不易;二是为了说明概念基元符号体系的定型来之不易。

为了说明这两个“来之不易”,让我们先回顾一下HNC理论的4项基本论断(见本卷卷首语),并写出相应的符号表示式,如下表所示:

 

表:HNC理论全貌[*02]

 

        基本论断                  数学表示式        物理表示式

概念无限而概念基元有限    (HNC1)            (HNC-1)

语句无限而句类有限        (HNC2)            (HNC-2)

    语境无限而语境单元有限;  (HNC3)            (HNC-3)

显记忆无限而隐记忆有限。  (HNCm,m=1-4)      (HNC-m,m=1-4)

        机器翻译的技巧无限

          但技巧的基本环节有限  (两转换、两变换、两调整)[HNC-m,m=1-6][*03]

 

(HNC1)表示式如下:

      (HNC1) ::= CT:((OD//ED)|;)

    第一个“来之不易”可以理解为(HNC-1)的来之不易。当然 (HNCm,m=2-4)和[HNC-m]也都来之不易,但与(HNC-1)比较起来,则不可同日而语。本《全书》为(HNC-1)付出了两卷的巨大篇幅,而为后者只分别付出了本卷的一编。

那么 “(HNC-1)的来之不易”与“每一个概念基元物理表示式的确定来之不易”是一回事么?应该是一回事,因为“概念基元物理表示式”与(HNC-1)完全等价。但又不完全是一回事,因为前者加了“每一个”的修饰语,而后者没有。这纯粹是一个人为的差异,但其依据很值得玩味。前者是站在延伸概念的立场说话的,后者是站在概念树的立场说话的,这意味着 前者如同那些在战场上浴血奋战的前线指挥员或战士,加“每一个”是合适的;后者则如同一场预定战役的设计者,那位高级指挥官虽然责任重大,但未必艰苦,加“每一个”就不太合适了。

上面给出的示例(a12)属于概念树里的乔木,其(HNC-1)一定是复杂的,但灌木型概念树的情况则有所不同,例如概念树“首尾标记f14”的(HNC-1)就比较简明[*04],但其延伸概念f14\k=2的意义却极不寻常,因为汉语使用频度最高的“的”字正好是它们(两者)的直系捆绑词语。如果不能抓住这一点 那就很难解析并征服汉语的劲敌C;同样 如果不能抓住“的”字乃是延伸概念“串联第二本体表现(句蜕)l42\k=3”[*05]之l42(~\2)的直系捆绑词语这一要点,那就很难解析并征服汉语的劲敌B。这两个论断已在第二卷里作了充分论述,这里不过是顺便回应一下,以示强调之意而已。

上面的叙述涉及到许多细节,这包括注释[*01]-[*05]。所谓“来之不易”就不易在这些细节上,而大局性的突破 与其说“来之不易”,不如说“来之顿悟”。顿悟不是难易问题,不是靠下苦功就可以出现;顿悟也不是天才问题,“天分+勤奋+机缘”才有可能顿悟。“表:HNC理论全貌”里的论断属于顿悟,其中的(HNC-m,m=2-4)也基本属于顿悟,但其中的(HNC-1)则属于典型的来之不易。正因为如此 《全书》里已给出的(HNC-1)几乎没有几个近乎完善的样板,这很可怕么?笔者又要祭出“笑而不答”的法宝了。

第一个来之不易存在如下的有趣问题:(HNC-1)或[CT-(0//0*)|]一共是256个么?这需要给出一个明确的回答,正确的答案是252,而不是256。为什么?读者参照一下“表:语言概念空间的第一基本景象”就可以明白了。

到此 第一来之不易的讨论可以结束了,下一小节还有一系列呼应性的阐释。不过 这里仍然打算重复一项细节,那就是[a12-0*0*]里的“7”和“\k=2”分别改成了[a12-0000]里的“i”和“\k=3”,这简单的两“改”就是所谓“概念基元物理表示式的确定”里的“确定”,它们貌似简单,实际上都来之不易。

下面转入第二个来之不易——概念基元符号体系的定型来之不易——的讨论。

此讨论将从一个特定的三阶段论开始,该三阶段论的具体陈述是:

《理论》阶段(1989-1998)

《定理》阶段(1999-2004)

《全书》阶段(2005-)

可以说 HNC理论的任何一个环节都存在这三个阶段的印迹,即使是最早发现的作用效应链和五元组也是如此,只不过两者在《理论》阶段的印迹最为浓重罢了。拿“表:HNC理论全貌”里的内容来说 可以给出下表的简要说明

        

            表:HNC理论全貌的三阶段印迹

 

      内容     《理论》阶段     《定理》阶段     《全书》阶段

      (HNC-1)      奠基           成熟             透齐

      (HNC-2)      有惑           无惑             精纯

      (HNC-3)      酝酿           顿悟             彻悟

      (HNC-4)      迷惑           小悟             大悟

      [HNC-m]      疑惑           浅悟             深悟

 

此表对(HNC-m)和[HNC-m]三阶段状态的文字描述都比较到位,将分别在本卷的前五编(五“前”论)里分别进行说明。这里仅针对关于(HNC-1)的“奠基、成熟和透齐”之三阶段说。

(HNC-1)在《理论》阶段的奠基性主要表现在以下六个方面,一是明确了抽象概念和具体概念的基本划分,并确定以抽象概念为语言概念空间描述的基本依托。二是发现了狭义作用效应链,并确定它是语言概念空间的核心要素,因为它是句类有限性的基本依据。三是发现了抽象概念的五元组特性,从根本上动摇了西方语言学的“八大词类”说。四是初步明确了抽象概念的基元、基本和逻辑这三大范畴的划分,给出了基元概念的纲领性描述框架和基本概念的精细描述框架。五是提出了概念基元符号体系之高层、中层和底层的描述模式,但那时只对高层和中层给出了一个框架性描述,底层还处于摸索状态,不过 已经想到了底层要采用不同于高层和中层的另一套表示符号,这在“论文1”和“论文6”里都有清晰的痕迹。六是提出了关于概念组合方式的一系列新思考。

(HNC-1)在《定理》阶段的成熟性主要表现在以下六个方面,一是彻底澄清了基元概念的范畴两分:主体基元和语境基元,并对语境基元给出了两类劳动和三类精神生活的基本划分。二是明确了逻辑概念范畴的四分:基本逻辑、语法逻辑、语习逻辑和综合逻辑。三是广义作用效应链的发现,将第一类精神生活的子范畴“思维8”纳入广义作用,将逻辑概念的子范畴“基本逻辑概念jl”纳入广义效应。四是明确了中层概念基元符号表示的四分:对比性、包含性、黑氏对偶和非黑氏对偶,对非黑氏对偶作了深入系统的探索。五是明确了底层概念基元符号表示的三分:交织性延伸、并列式延伸和定向延伸。六是将《理论》阶段关于概念组合方式的一系列思考进一步发展成为统一的概念关联式这一高级形态。

(HNC-1)在《全书》阶段的透齐性主要表现在以下9点,考虑到这9点的特殊重要性,后文可能对它们使用一个特殊称呼:“透齐-m号”(m=1-9)。

1)最终确定了语言概念空间描述的三分:抽象概念、具体概念和挂靠概念,彻底改造了“挂靠”的原始思路,使之成为灵巧思维的有力武器。这一点 将在第四节里作进一步的阐释。

2)最终确定了全部概念基元之概念范畴-子范畴-概念林-概念树的详尽清单,从而达到了“表:语言概念空间的第一基本景象”所描述的“绝顶”境界,此绝顶者 (HNC-1)上行思考之绝顶也。

3)将第三类精神生活的描述向第二类精神生活看齐,也给出表层与深层的两分。这使得三类精神生活的划分赢得了更充分的文明学依据。

4)《定理》里提出的四项基本原则(《尔雅》原则、语境原则、关联原则和延伸原则)得到了全面落实[*06],并提出了一个统辖四项基本原则的指导性原则,名之透彻性和齐备性原则,简称透齐性原则,也叫康德原则。该原则的运用等同于灵巧思维的具体展现,既是上行思考的灵魂,也是下行思考的灵魂,前两卷里 曾多次给出过示例性的插写。

5)将《定理》阶段的概念树和根概念依次改名为概念林(群)和概念树,并统一约定:以概念树为基点 向下施行认识论描述(原中层)和本体论描述(原底层)的分级延伸,并将该分级延伸表示式正式定名为概念延伸结构表示式,该表示式里的每一延伸项定名为延伸概念,以区别于概念树及其上位所表述的全部概念,“概念节点”的术语被正式废除。

6)理清了概念延伸结构表示式可以和必须管辖的知识,把它正式命名为世界知识,以区别于专家知识以及动物与人类的生理性知识(常识的主要部分)。与此同时 正式提出了大脑存在五大区块的假说,依据大脑理所当然的进化顺序 将五大区块依次定名为形象脑、情感脑、艺术脑、语言脑和科技脑。世界知识实际上就是语言脑知识的别称,语言学所关心的语言知识和心理学所关心的行为知识都只是语言脑知识的一部分[*07]。

7)正式提出了语言理解基因的概念,把它定义为语境概念树各级延伸概念及其概念关联式的总和,简言之 语境概念树的每一项延伸概念及其概念关联式就对应着一个语言理解基因。但没有直接设置概念关联式的延伸概念并非语言脑世界的“孤岛”,因为它可以通过其上位概念加入概念联想脉络的运作。

8)将概念基元的中层和底层描述分别命名为认识论描述和本体论描述,此命名乃是《老子》所说“名可名,非常名”里的可名之名,而不是那个“非常名”[*08]。此项命名乃是(HNC-1)可以达到横向延伸透齐性的标志

9)为(HNC-1)纵向延伸的透齐性描述制定了相应的标准,那就是以接近但不进入各领域的专家知识为界限。

以上9点是对“概念无限而概念基元有限”这一论断的体说,1-3点涉及上行思考,4-7点兼及上行与下行思考,8-9点涉及下行思考。最后两点里存在着比较深奥的内容,本小节的随后3小节和本节的随后3节会给出进一步的阐释,其他已见于前文而略显深奥者则尽量给出了相应的注释。

 

4.1.2概念延伸结构表示式的符号说明

HNC的朋友几乎都对HNC符号体系望而生畏,对笔者的HNC文字都会客气地说一声“看不懂”。前面已经给出了概念延伸结构表示式里的两个示例,那里的符号体系也许更会使读者不寒而栗。但笔者相信 对于“表:抽象概念3大范畴及其子范畴的表示符号”和“表:语$L太Wx趎ME$L太Wx趎 说“看不懂”的朋友应该比较少了,对里面的符号 应该不再望而生畏了;笔者更希望 通过本小节的“符号说明” 那不寒而栗也许会趋于消失。但这个希望能达到么?笔者深感力不从心!

一般情况下 “符号说明”就是相应符号的汉语词典,也就是对每一个符号给出一段文字说明。但这里的情况要稍微复杂一点,它不仅是一个挨着一个的符号,还有点别的什么东西,这里先说一说这个“别的东西”。

前文有言:

HNC对概念树及其上位概念所采取的描述方式似乎与通常的分类学(例如生物学分类和图书分类)没有本质区别,但实质上存在着本质差异,主要表现在两个方面:一是概念范畴的灵巧性符号表示;二是概念林和概念树的灵巧性符号表示。”(见本编的1.1.2小节:概念和概念基元都需要采取灵巧式定义)

这段话后面 对概念范畴、概念林和概念树的灵巧性符号表示给出了具体的阐释,虽然那属于上行思考的灵巧性,与这里要说的下行思考有所不同,但本质是相通的,请回去翻阅一下。

这里的“别的东西”是指下列三方面的内容:(1)横向与纵向延伸的透齐性;(2)自延伸的自由性;(3)非、反和非分别说的限制性。但是 透齐性有相对与绝对之别,自由性与限制性可以相互转换。这就是说 横向延伸、纵向延伸、自延伸、非、反和非分别说这六个话题本身都属于灵巧性话题,下文将依次进行讨论,题目列举如下:

——关于横向延伸的透齐性

——关于纵向延伸的透齐性

——关于自延伸的自由性

——关于非的限制性

——关于反的限制性

——关于非分别说的限制性

 

    这些讨论只是本小节主体内容的预备性说明,但其文字量将喧宾夺主,这是需要首先说明一声的。其次要说明的是 在预备性说明里还可能嵌套着预备性说明,这是令人厌恶的行文结构,但笔者思虑再三 还是决定出此下策,读者可能对此很不习惯,下文会随时加以提示。因此 本预备性说明的行文比较长,本小节将采取子节编号。前两个子节还存在预备性说明的嵌套现象。

下面的讨论将以概念延伸结构表示式的两个示例为基本依托,两示例的内容(后者仅选取了前两级延伸)拷贝如下:

         a12:(t=a,3,7,\k=2,;9t=a,ae2m,3eam,7m,)——[a12-0*0*;]

         a12:(t=a,3,i,\k=3,7;

              9t=a,ae2m,3:(e2m,eam,n),i:(n,e2m),\1*t=a,\2:(e2m,*t=a),\3k=5;

                                                        [a12-0000]

 

4.1.2.1关于横向延伸的透齐性

概念延伸结构表示式各级横向延伸联系于横向透齐性,延伸级别本身联系于纵向透齐性。横向透齐属于透齐8号,纵向透齐属于透齐9号。符号[a12-0*0*;]表明 其纵向延伸是不透齐的,两级横向延伸也都是不透齐的。符号[a12-0000]表明 其纵向延伸和各级横向延伸都是透齐的。所以 两个示例是这两个极端情况的代表,下文以此为基础 对横向透齐性作进一步的考察,先给出如下的对照数据:

                    一级延伸项             二级延伸项

    [a12-0*0*;]     (4;6=2+1+1+2)          (4;5=2+1+1+1)

    [a12-0000]      (5;8=2+1+1+3+1)        (11;18=2+1+3+2+2+3+5)

 

这里给出了对横向透齐性的数字描述:一级延伸的(4;6)与(5;8)和二级延伸的(4;5)与(11;18)。这些数字都成双出现的,前者对本体论描述和认识论描述一视同仁,有一项算一项。后者将两者区别对待,认识论描述依然,但对第一和第二本体描述 则计及本体的数量,

(4;6)里的“6”是这样得到的,其他类推。就概念树“治国a12”的一级延伸来说 (4;6)与(5;8)之间的差距不大,似乎可以说 [a12-0*0*;]是基本透齐的;但二级延伸的(4;5)与(11;18)之间的差距太大,似乎可以说 [a12-0*0*;]是很不透齐的。这里使用了“很不透齐”和“基本透齐”的说法,请读者记住这两个术语。因为这两个术语既是整个HNC探索历程的写照,也是HNC探索对自身的定位。即:努力摆脱“很不透齐”的窘境,全力迈向“基本透齐”的境界。就语言脑的整体而言 它应该具备全部的“透齐-m号”,但对每一个具体的语言脑(每一个人)而言 就不能这么断言,“基本透齐”应该是最合适的描述。语言脑本身尚且如此,那就没有理由对模拟语言脑提出更高的要求了。

不存在无所不包的透齐性,只存在一定条件下的透齐性,而所谓一定条件下的透齐性也就是一定条件的无所不包性。在“透齐-m号”的论述中 都对“一定条件”给出了充分的形而上描述,横向透齐性的“一定条件”就是本体论描述和认识论描述。

横向延伸概念的透齐性似乎是一个不存在难题的问题,因为其透齐性特质不可能呈现出一种“浩瀚无垠”的景象,象概念子范畴、概念林和概念树所展现的那样。这里的关键思考是:横向延伸的透齐性仅涉及本体论描述和认识论描述的运用,而两者的描述数量都是有限的。本体论描述最多5项(两类本体论延伸各1项,定向延伸最多3项)[*09],认识论的对比描述虽然不便说什么最多[*10],但对偶描述和包含性描述都是可以说的,黑氏对偶最多两项,非黑氏对偶最多12项,包含性仅1项。这就是说 横向延伸的透齐性问题不过是一个比较简明的挑选问题,从有限的选项中进行一定的挑选而已。

以上还是纯粹的形而上说,下面依托[a12-0*0*]转入半形而上说。

概念树a12的汉语名称是治国,这是一个内容极为庞杂的人文社会学课题,但是 符号a12让它先辖属于政治(通过a1),接着辖属于专业活动或第二类劳动(通过a),在这个语境下 “治国a12”的一级延伸概念不过“区区4项”就满足了透齐性要求[*11]。该特定4项全属于本体论描述,前3项属于交织性延伸(第一本体描述)、作用型定向延伸、效应型定向延伸,最后一项属于并列式延伸(第二本体描述)。

在半形而上的视野里 一级延伸概念的“区区4项”也可以说成“区区6项”,这是从“t=a”和“\k=2”变出来的,于是 下面的灵巧性表示式成立:

4 =: 6”(6=2+1+1+2)

接下来看二级延伸概念,依然是“区区4项”,但其中仅出现一项本体论描述,而认识论描述却有3项,这样 二级延伸概念的“4”实际呈现为“5”,下面的灵巧性表示式成立:

          “4 =: 5”(5=2+1+1+1)

    上面的灵巧性表示式看似数字游戏,实际上是对“有限选项中的挑选”作进一步的说明,原来 被命名为第一//第二本体描述的延伸与定向延伸不同,它们本身还不是一个完整的符号,还必须与一个数字符号搭配起来才构成一个完整的表示。

以上所说 似乎很玄而实际上一点也不玄。如果对HNC定义的本体论描述和认识论描述及其符号表示没有一点领悟,那它确实很玄;如果有所领悟,它就不那么玄了,如果有比较深切的领悟,那就一点也不玄了。那么“没有一点领悟”、“有所领悟”和“深切领悟”是什么意思呢?笔者只会说一点让现代读者见笑的话了。如果仅仅把“t=a”与“\k=3”当作一类数据,把“e2m”、“eam”与“n”当作另一类数据,那就叫“没有一点领悟”;如果知道这些符号之间存在本质差异,需要采取本质上有所不同的数据处理方式,那就叫有所领悟;如果进一步知道这些符号不是一种类似于自然语言之词语的那种“独立”式存在,而是一种联系于其上下文的非独立存在,这个上下文完全不同于自然语言的上下文,它不是当前数据库所面对的那种无机数据,而是一种有机数据,因为它没有任何模糊与跳跃,如同一支军纪严明、行伍整齐的部队。如果有了这种有机数据的认识,那就叫理论深切领悟(或基础领悟);如果依据这个基础领悟而进一步开发出一种针对有机数据的新型数据处理方案,那就达到实践深切领悟的水准了。玄或不玄的界限就在于此,这个界限也可以叫做鸿沟。

以上所说 属于预备性说明里的嵌套,下面进入正式的预备性说明。

上文所说的有机数据实质上就是语言理解基因(见本卷第三编)的别名,上文提到的那些符号就是语言理解基因的氨基酸。语言理解基因氨基酸的种类是有限的,横向延伸的最大限度不过是把全部氨基酸都使用一次。这个说法如此简明,就如同一项公理,是关于横向延伸透齐性的顶层阐释。不言而喻 这是一个关键性的论断,因为一切“横向延伸透齐性”的论述都必须立足于此。这个立足点要求对语言理解基因氨基酸给出一个穷尽性描述,这项描述放在哪里呢?(HNC-1)需要使用语言理解基因氨基酸,而语言理解基因又属于(HNC-3)的内容,这似乎构成了一个特别吊诡的吊诡:是(HNC-1)在先还是(HNC-3)在先?说“吊诡”而又以“特别吊诡”修饰者 无吊诡之意也,即不必追究两者的前后之分也。语言理解基因氨基酸是破解语言理解基因的金钥匙,对这把金钥匙给予特殊照顾乃是理所当然的事。所以 本《全书》不得不在第一卷(见期望行为7301\21子节[123-0121]的结束语)给予了系统预说,已读过该预说的读者不妨再翻阅一遍。

横向延伸透齐性的顶层阐释也可以看作是一种数学描述,它所关注的仅仅是一个集合的完备性问题。而针对一株特定的概念树(如a12)之延伸描述 或其一项特定延伸概念(如a129)之延伸描述就不再是一个纯粹的数学问题了,所谓的延伸描述就是指应该选择哪些语言理解基因氨基酸捆绑于其上,这就变成一个物理问题了,而物理问题就允许有所取舍,这属于物理意义的透齐性,而不是数学意义的透齐HNC把这项物理意义的透齐探索叫做语言理解基因氨基酸的捆绑。在《全书》的撰写过程中 笔者几乎花费了85%的时间从事这项捆绑工作,[a12-0*0*;]是前期捆绑的范例,[a12-0000]是后期捆绑的范例。从这两个范例的对比 可以看到连贯性的明显印迹,更可以看到灵巧性的明显印迹。本子节前面的数字游戏说明就是灵巧性印迹的展现。

语言理解基因氨基酸是开启哪些“宫殿”大门的金钥匙呢?核心“宫殿”群的名称是:作用效应链、基本概念和综合逻辑概念。这些宫殿的墙壁是什么?是图象脑、情感脑、艺术脑和科技脑,它们不仅是核心“宫殿”的四面墙壁,也是所有“宫殿”的四面墙壁。但应该指出 这四面墙是内墙,不是外墙,外墙的说明见下一子节。这四面内墙的差异很大,情感脑内墙的形态尤为复杂,汉语的著名成语“犬牙交错”也远不足以形容。不过 在第一类精神生活(71+72+73,8)这个概念子范畴里 HNC对该内墙的复杂形态或面貌给予了力所能及的的描述或梳理。

    每株概念树就是一座“宫殿”,其中 作用效应链、基本本体、基本属性和综合逻辑这4类概念树所构成的“宫殿”是语言概念空间的核心“宫殿”,语境基元概念树所构成的“宫殿”是语言概念空间的主体“宫殿”,其他概念树所构成的“宫殿”可统称语言概念空间的附属“宫殿”。对此论断若有所晤的读者不妨追问一声 以往的语言学研究是否仅偏重于附属“宫殿”的探索呢?这样的追问一定有益于灵巧思维的培育。

概念树的概念延伸结构表示式就是对一座“宫殿”的结构与功能描述,每一项延伸概念也是一座小“宫殿”,可名之“宫中之殿”或“殿中之宫”。在HNC探索的起步阶段 曾试图使语言概念空间“宫殿”的基本样板或基本特征在作用效应链、基本本体和基本属性这3个概念范畴里完整地呈现出来,后来 在横向延伸透齐性的不断探索中逐步发现 起步阶段的这个如意算盘乃是一个“三缺一”的低级失误,基本本体和基本属性都属于基本概念,必须再加一个综合逻辑,才能形成“基元、基本与逻辑”三足鼎立的完整组合。让三者分别充当“宫殿”样板的三位代表,堪称“不二之选”,这三者将名之三大“选区”。作用效应链将名之第一“选区”;基本概念将名之第二“选区”,综合逻辑将名之第三“选区”。应该惭愧地说一句 在HNC探索历程中 三大“选区”是最重要的一项领悟(不是之一),这个领悟本来可以完全可以来于先验理性的透彻思考,但实际情况并非如此,最终还是借助了经验理性的长时间摸索。

上述“三缺一”低级失误的印迹 从《理论》到《定理》清晰可见,读者不可不察。这是当年还没有三大“选区”领悟的铁证。

    三大“选区”的领悟是整个HNC探索历程中的一次关键性提升,说横向延伸物理意义的透齐性也好 语言理解基因氨基酸的捆绑也吧 最终都要落实到对三大“选区”具体代表的选择。语言概念空间主体“宫殿”的设计即以此项选择为基本依托,附属“宫殿”的设计也以此项选择为基本参照。这选择与参照 就需要灵巧思维,就意味着无限已转化为有限。这个说法是“似乎很玄而实际上一点也不玄”景象的又一次展现,读者以为然否?

 

4.1.2.2 关于纵向延伸的透齐性描述

上一子节说了语言概念空间“宫殿”的内墙,本子节就关乎该“宫殿”的外墙了。

HNC把语言概念空间“宫殿”群之内的知识叫世界知识,把“宫殿”群之外的知识叫专家知识。这里的内外以外墙为界,而不是以内墙为界。当今 是专家知识特别吃香的特殊历史时期,人们都误以为专家知识的总和就是世界知识的全部,专家知识就包含世界知识,没有比这一误解更离谱的误解了。

后工业时代的曙光已经非常明亮,专家视而不见;六个世界已经赫然存在,专家基本视而不见;经济公理的呈现已经如此明朗,专家还是视而不见;资本不能等同于资本主义,有些大专家却把资本主义的罪恶归咎于资本;“资本+技术”才是所谓的第一生产力,这个亚当•斯密先生早已揭示出来的真理却被许多杰出人物以语言面具性名言予以替代或掩盖;金帅主要靠阳谋忽悠这个世界,只有少数过度贪婪者才搞点所谓阴谋,因为在第一世界搞阴谋的风险毕竟还是巨大的,然而 有些专家却热中于揭发所谓的金帅阴谋,而对其昭然若揭的众多阳谋却熟视无睹;人类家园亟待拯救,对科技无限和丛林法则的继续迷信将导致人类家园的毁灭,然而 专家却依然对这两项迷信奉若神明,大量专家则仅仅热中于如何温室气体效应的争论;工业时代的真理不一定继续适用于后工业时代 民主制度的局限性日益彰现,是重新思考领袖与民众互动关系的时候了,政治领袖被民众牵着鼻走的状态就是最佳的政治生态么?HNC把所有这些现象叫做世界知识的匮乏,罗斯福先生曾提出过著名的四大自由[*11],现在应该补充一项自由,提倡五大自由,但这第五项自由不是什么网络自由,而是免于世界知识匮乏的自由。

这些世界知识存在于什么地方呢?就在语言概念空间“宫殿”群的外墙之内,外墙之外才是专家知识。当然 这个外墙不可能是一面实在的墙壁,而是一个巨大的模糊地带。但空谈其巨大模糊性没有什么意义。怎么办?就把纵向延伸的终点定义成外墙吧,这一定义的关键在于 要把一项可爱的特性赋予这些终点,那特性名之可扩展性(或终点的可移动性)。同时 对可扩展性赋予“叩其两端”的描述方式,[a12-0*0*;]是一种描述方式,[a12-0000]是另一种描述方式。两种方式都只是提个醒而已,对后者也并不剥夺其可扩展性。这就是灵巧思维了。

本分节到此可以结束了,但下面将预写一段本来打算安排本编之跋里的话。

许多HNC的朋友对“概念无限而概念基元有限”的论断采取一种回避态度,他们理所当然地认为 社会是发展的,语言也是发展的,新概念、新词语将永远层出不穷,这是一个基本事实。基于对这一基本事实的认同 他们在理论上就难以认同“概念基元有限性”的论断。这里 笔者要向这些朋友们说:上述基本事实与“概念基元有限性”的论断并不矛盾,因为该论断不同于通常意义下的论断。通常的论断多数是一竿子思维模式的论断,而“概念基元有限性”的论断则是灵巧思维模式的论断,其有限性既是静态的,又是动态的。以概念范畴--概念林--概念树为参照 它是静态的;以延伸概念为参照 它是动态的。我们能不能说 大多数自然语言都远没有利用概念树的全部资源呢?人类自然语言的总和也还没有充分加以利用呢?答案应该是:“能这么说”,因为 无比辉煌的英语就没有充分利用概念林“l0”辖域里全部概念树的资源,许多重要的延伸概念都缺乏对应的自然语言表述,以延伸概念为参照 可以说自然语言经常陷入“辞不达意”的困境[*12]。HNC不是跟在自然语言后面进行观察与探索,而是走在前面等待着自然语言的发展。前面者 语言概念空间也,彼山及其景象也。这段话就写这些,不过是以往多次相应论述的重复而已。但这次重复乃安排在“横向延伸的透齐性描述”和“纵向延伸的透齐性描述”之后,就更显得言之有据了。

 

4.1.2.3 关于自延伸的自由性

自延伸是HNC引入的一个术语,特指语言理解基因第二类氨基酸里非对偶性符号的运用,也就是对比性符号和包含性符号的运用。这就是说 存在着两类自延伸,一是对比性自延伸,二是包含性自延伸。

自延伸具有高度的自由性,这就是说 任何延伸概念都拥有自延伸的自由。但两类自延伸的自由性又有所不同,对比性自延伸主要自由于抽象概念和物性概念,包含性自延伸主要自由于具体概念,并特别自由于挂靠型具体概念。

自延伸可进入概念延伸结构表示式,也可以不进入。其符号表示就是对两类自延伸另加小括号:对比性自延伸——(okm);包含性自延伸——(-k)。

    对比性自延伸可以看作是所谓“原级—比较级—最高级”描述方式的扩展;包含性自延伸可以看作是“部件”概念的扩展。

 

4.1.2.4 关于非的限制性

HNC定义的非就是数理逻辑的非,不是自然语言的非,也不是基本逻辑里的非,更不是佛经里的非。前者的非必须对应于一个确定的集合,后三者的非则可以不对应。因此也可以说 HNC的非乃是特指的非,后三者的非乃是泛指的非。

非的表示符号沿用数理逻辑的“~”,所谓非的限制性 是指该符号仅使用于三大类语言理解基因氨基酸的部分要素,这包括本体论描述OD的第一类和第二类本体符号、认识论描述ED的黑氏和非黑氏对偶符号和五元组描述的“v”。这就是说 HNC的非一共有三类,也只有三类,可分别名之本体论非、认识论非和五元组非。

也许不少读者对上面的文字很不习惯,但笔者要说 只有这样的文字才能准确描述HNC定义的非,并进而写出其物理意义的符号表示。

三类非表示的前两类一定联系于(OD;ED)的常量表示,常量的不同选择就会形成不同的非表示。这就是说 本体论非和认识论非可以有丰富的形态,但五元组非只要一个,那就是“~v”。

顺便说一声 三类非的明确虽然只是HNC探索历程的一个小插曲,但给笔者带来的愉悦并不小。五元组非曾名之动词异化,这个命名表面上是一件小事,由于它与三大类语言理解基因氨基酸联系在一起,使笔者更加坚定了对于“八大词类”的反思,更加活跃了如何降伏汉语劲敌B的思路。

 

4.1.2.5 关于反的限制性

    正与反是自然属性的基本呈现之一,对应的HNC符号是j71e2m。那么 概念基元是否都存在正反特征呢?这并不存在一个显而易见的答案,“有正必有反”的命题不是当然成立的,无论是具体概念还是抽象概念都是如此。

应该说 存在正反特征的概念基元属于最可爱的概念基元,对于这样的概念基元 HNC力求一个也不漏掉,故e2m属于语言理解基因氨基酸捆绑的首选对象之一。但是 反的呈现不可能仅仅表现为氨基酸的形态,它应该还拥有其他的或另外的形态,HNC将使用符号^(CP)来描述反的这一形态,这是HNC的一项特殊约定。

符号^(CP)是反的数学描述,在概念延伸结构表示式里 需要反的物理描述,相应的描述符号是^(EC)。下面是一个具体的示例[*13]:

72019:(,9γ=a,;99e5n,9a(d01,c01),^(y9a);^(y9ac01))——[72019-00]

    72019γ=a     目标与要求分别说

    720199        (自我)目标——“目标”

     720199e5n        “目标”的三分描述

     720199e55        行善

     720199e56        作恶

     720199e57        明哲保身(“自保”)

    72019a        (自我)要求——“要求”

     72019ad01        严格要求自己

     72019ac01        “要求”底线

     ^(72019a)        放任

      ^(72019ac01)      兽行

 

概念延伸结构表示式[72019-00]带引号的汉语说明文字都属于前述“辞不达意”的典型例子。应该说明 要不要给延伸概念的文字说明带上引号有时是很费思量的,《全书》的分寸把握时紧时松,这是需要向读者致歉的,不过概念延伸结构表示式[72019-00]里汉语说明文字所用的引号都比较准确。引入这个示例 一方面是为了与前文“跋之预说”相呼应,另一方面是为了诠释“反的限制性”。

在对[72019-00]进行正式说明之前 需要先介绍一下一级延伸概念72019的家族背景。它属于“常态意志7201”这株概念树,该概念树的概念延伸结构表示式(加了编号)和部分汉语说拷贝如下:

7201:(t=b,e7m,e2n;(t):(3,e5n),tγ=a,a:(d01,c01),bean,e2ne2n;

^(ytγ),9a:(d01,c01),99e5n;

^(y9ac01))——[7201-0000]

7201t=b      常态意志的基本内容

72019        目标与要求

7201a        坚持与毅力

7201b        适应与调整

 

  7201(t)      意志力

 

延伸延伸概念7201t=b也可名之“常态意志的第一本体呈现”(这是HNC后期更常使用的语言),它是从哪个“选区”选出来的代表?答案是第一“选区”。72019大体对应于作用与效应;7201a大体对应于过程与转移,7201b大体对应于关系与状态。由于只是大体对应 这里的氨基酸符号“t=b”绝不能以“β”替换。这些似乎是题外话,但对于下面的论述具有预说意义。

    下面回到[72019-00]。我们看到:延伸概念72019a在自然语言里就没有对应的词语,其再延伸概念72019ad01有一个比较准确的短语——严格要求自己,但另一个再延伸概念72019ac01就缺乏合适的词语或短语了。有趣的是 延伸概念72019a的反却拥有十分传神的汉语词语——放任;再延伸概念72019ac01所对应的词语也是这个情况,其反“^72019ac01”也拥有传神的词语——兽行。

一级延伸概念72019的再延伸概念仅有一项,选择了准第一本体“γ=a”,这个氨基酸比较特别,其代表通常来于不同的“选区”,本示例正是这个情况,720199来于第三“选区”的“追求s108”;72019a来于第一“选区”的“约束04”。由于“约束04”与“免除03”是一对孪生兄弟[*14],因此 从72019a派生出“放任^(72019a)”和“兽行^(72019ac01)”乃是概念联想脉络的一种“水到渠成”景象。

所谓概念延伸结构表示式的设计实质上都是对概念联想脉络景象的叙述,上面具体给出了一种水到渠成的景象。此叙述不同于一般的叙述,它代表一种境界,不是可以轻易达到的。大部分概念延伸结构仅能达到描述的水平,离叙述总有一定的差距。不过 这里可以说一声 [72019-00]已十分接近于叙述,但前面的[a12-0000]就不能这么说,至于[a12-0*0*;] 那不过是一个很粗糙的描述而已。

现在 我们可以说这样一句话了。所谓“反的限制性”实质上就是概念联想脉络固有属性的一种特殊呈现。在《全书》撰写过程中 笔者对这一特殊呈现给予了力所能及的关注。

本分节和上一分节都在讨论限制性,我们已经看到 这是两种性质截然不同的限制性,读者自己领会一下吧。下一分节将展示另一种类型的限制性。

 

4.1.2.6 关于非分别说的限制性

本分节也从一个例子“意志力7201(t)”说起,它来于[7201-0000]。其概念延伸结构表示式和汉语说明拷贝如下:

7201(t):(3,e5n)

 7201(t)3         意志力培育

     7201(t)e5n       意志力的基本描述

         7201(t)e55       (意志)坚强

         7201(t)e56       (意志)薄弱

         7201(t)e57       缺乏意志力

 

这里顺便交代一个细节。在[7201-0000]里 没有把7201(t)当作一个独立的延伸项,于是就把“7201(t):(3,e5n)”直接当作二级延伸项,这是对非分别说的一种表示方式。另外 也有把非分别说直接当作独立延伸项的情况。为什么要区分“独立与附属”这两种情况呢?因为非分别说延伸概念的五元组分布特征可能差异很大,如果五元组分布比较均衡,那就当作独立项来处理;如果该分布极度不均衡,其中的“v,g”弱存在,而“u,z,r”强存在,那就按附属项来处理。7201(t)属于五元组分布极度不均衡是情况,其“v,g”很弱,但“r”强存在,更细致的描述是:“rz”强存在。因此 它就被当作附属项来处理了。

读者可能质疑 如此重要的细节竟然放在这里来交代,那是否过于“马后炮”了呢?回答是:惭愧,谢谢。

    意志力的论述多矣!7201(t)的描述方式有什么独特或高明的地方呢?请回到上一子节的[7201-0000]吧,看一下HNC对“常态意志基本内容7201t=b”进行了怎样的描述,把“目标与要求72019”、“坚持与毅力7201a”、“适应与调整7201b”这三样东西捆绑在一起不是一件轻易的事,它需要概念树“常态意志7201”和语言理解基因氨基酸“t=b”这两根拐杖或两件工具,并需要费一番心思。这番心思仅在自然空间是无能为力的,连天才的乔姆斯基先生都“无策辨东西”[*15],何况他人?然而 这项捆绑并不是HNC描述的全部,常态意志7201作为一株概念树 其上方有概念子范畴“意志72”和概念林“意志基本内涵720”管着,概念树7201作为一个概念家族 又派生出三大分支,7201t=b诚然是其中的主要分支,但毕竟只是分支之一,而不是全部。“天才乔姆无策辨东西”的根本缘由就在于此了,这个“此”不是一般意义的此,此“此”者 前述上行思考与下行思考之途径也。非分别说的7201(t)乃是下行思考的特殊途径之一,这样的特殊途径一共有四条,另外三条 前面已经说过了。这些特殊途径是否有点独特或高明呢?读者自行思考一下吧。

    那么 “非分别说的限制性”是什么意思呢?答案是:主要是一种类型的概念最有可能需要给出分别说和非分别说的明确区别,那就是两类本体论描述所表示的延伸概念。请注意这个答案里的三个修饰用语:“主要是”、“最有可能”和“明确”,这意味着其他某些类型的延伸概念(例如对比性延伸或对偶性延伸)也有可能需要作非分别说,但毕竟属于罕见情况。一些读者可能对本段的说明文字感到厌恶,对本子节的某些文字可能很不以为然,那就请包含一点吧。

 

4.1.2.7 延伸概念符号表示的6个要点说明

以上6个子节都属于预说,不仅是本小节的预说,更是嗣后两节(不是随后的两小节)的预说。预说之后 本子节才正式回到本小节的主题——概念延伸结构表示式的符号说明,还搞了“偷工减料”的小动作,从“符号说明”变成了“6个要点说明”。不过 如果能理解预说的“苦衷”,那么 这点小动作就是不难理解的了。下面是六个要点的清单。

要点1:关乎符号“:(…)”,它用于表示概念的横向延伸。对于概念树 该符号在任何情况都不可省略,哪怕是单项、单级的最简延伸结构。但对后续延伸概念就不同了,在单项延伸情况 该符号可自然省略。

    要点2:关乎符号“,”,它用于表示横向延伸的有序排列。

    要点3:关于符号“;”,它用于表示纵向延伸的递进。

要点4:关乎符号“,;”或“,)”,皆用于表示概念延伸结构的开放性,无此则表示可予以封闭。

要点5:关乎语言理解基因的氨基酸,约定只有第一和第二类氨基酸符号可进入概念延伸结构表示式。

要点6:关乎语言理解基因的染色体,约定只有特定前挂符号(52,53)和特定逻辑符号(^,~)可进入概念延伸结构表示式。

这个清单表明 预说里的自延伸和非分别说被排除在要点之外了。为什么搞这个差异待遇呢?读者自行思考吧。

 

小节结束语

本小节是本节(概念延伸结构表示式简介)的主体,也是本章(概念延伸结构表示式)的主体。以本节为参照 本小节之前的内容是回顾与铺垫,其后的内容是遐想与疑团;以本章为参照 本小节也处于同样地位。回顾与铺垫代表着HNC探索历程早期与中期(即《理论》和《定论》阶段)取得的主要成果,对应于HNC的以往;遐想与疑团代表着HNC探索历程尚未进入的理论园地,对应于HNC的未来;本小节则代表着HNC探索历程在《全书》阶段的基本成果,对应于HNC的当下。该基本成果的名称就叫做概念延伸结构表示式。

概念延伸结构表示式的基本问题是横向和纵向延伸的透齐性,本小节对此作了系统的阐释。该阐释里最关键的陈述是:概念树的概念延伸结构表示式就是对一座“宫殿”的结构与功能描述,每一项延伸概念也是一座小“宫殿”,可名之“宫中之殿”或“殿中之宫”。这一陈述表达了本结束语的心声,够了。

 

注释:

[*01] 此注释标号出现了三次,都涉及概念延伸结构表示式及其编码。这里第一次给出了两个编码示例:[a12-0*0*;]和[a12-0000]。该编码的一般形式是:

[CT-(0//0*)|];[CP-(0//0*)|])

两者将分别简称概念树编码和延伸概念编码,皆以方括号[…]为形态,以区别于概念关联式编码的圆括号(…)形态。符号“(0//0*)|”的个数代表延伸级数,“0”和“0*”分别表示该级延伸的封闭或开放。示例表明:同一株概念树(治国a12)的第一个概念树编码是全开放的,而第二个编码是全封闭的。但在《定理》时期 对于开放与封闭的认识还不够透彻,还没有表示开放型延伸的符号。[a12-0*0*;]表示式里的开放符号“,;”在《定理》并不存在,是这次拷贝后加上去的。

[*02] 本表特意以全貌命名,因为本表的五项基本论断足以代表HNC理论的全貌。本卷的前五编就是对五项论断的系统阐释。五项论断以第一项为基础,前两卷就是对第一项论断的分别说,本卷是其非分别说。不过 本卷内容曾在前两卷里作过多次预说,而《定理》早就给出过基本阐释,包括第五项论断的雏形描述。这里首次出现的新表述形式仅限于第四项,原先的(HNC4)和(HNC-4)表述形式被替换了,以便于与第四项文字表述对应。显记忆者 (HNC-4)也;但隐记忆者 以(HNC-m,m=1-3)为主,而非全部也。这是应该强调一下的,详见第四编。

[*03] 这里用编码符号[HNC-m,m=1-6]替换以前曾经使用过的(HNC-5),它表示HNC提出的关于机器翻译六项过渡处理理论。六项过渡处理简称“两转换、两变换和两调整”,属于本卷第五编的内容。六项过渡处理是在《定理》中的第二篇论文里(pp65-76)首次提出来的,不过 那里的表述并不清晰,两转换的正式表述是:句类转换和句式转换;两变换的正式表述是:语块构成变换和语块主辅变换;两调整的正式表述是:辅块位次调整和小句序次调整。近十年来 已有十多篇博士论文围绕着六项过渡处理进行过开创性的探讨,张克亮博士和李颖、池毓焕两博士还分别出版了两部专著。

[*04] 该概念树属于“语习逻辑f”,见“第二卷 第五编 第一章 4 首尾标记f14”([250-14])。

[*05] 该延伸概念属于“语法逻辑l”的概念树“串联l42”,见“第二卷 第四编 第四章 2节”([240-42])。

[*06] 《尔雅》原则的落实对应于透齐1号,语境原则的落实对应于透齐2号和3号,关联原则的落实对应于透齐5号,延伸原则的落实对应于透齐6号。

[*07] 语言学所关心的语言知识集中于“语法逻辑l”和“语习逻辑f”这两个子范畴里,但语法学仅研究此山景象,本《全书》在相应两编里所描述的一系列彼山景象都未进入语言的视野,故这里使用了“一部分”的说法。心理学所关心行为知识集中于7301、7302和7303这三株概念树里,对于“言与行731”、“行为的形而上描述732”、“行为的形而下描述733”这三片概念林所描述的世界知识涉及不深或尚未涉及,“一部分”的帽子对它似乎更为合适。

[*08] 该命名的哲理性阐释需要另写专文,相应术语的是否使用曾使笔者思量甚久,直到《全书》撰写的中期 才大起胆子开始起用了。

[*09] 本注释和前面的两项注释都带有一定的HNC普及性,这是需要说明一声的。第一类本体论描述有4种类型:字母符号分别是(t,α,β,γ),但在每一组横向延伸里 只能选用其中的一种,否则就会造成HNC符号体系的不确定性(模糊性或多义性),沦落成跟自然语言符号体系“沆瀣一气”了。因此 这里的“4选1”乃是HNC的必然约定或上帝命令。γ延伸也叫做两可延伸,这里为便于叙述 就合并第一类本体里去了。两可者 第一类与第二类本体之间了,可名之准第一本体。第二类本体论描述有两种形态:“\k=1-m”和“\k=0-m”,前者简记为“\k=m”,同理 在每一组横向延伸里 两种形态也只能选择一个。

[*10] 就认识论对比描述的“cko”或“dko”形态来说 “k”的取值不同就代表不同类型的对比描述,

[*11] HNC对四大自由有一段评说,见

[*12] “辞不达意”困境可以说是本《全书》撰写过程最大的苦恼,突出事例可见“情感基本表现7131”概念树的说明文字([121-31]节),下面的4.1.2.5子节会给出结合实际示例的说明。

[*13] 这个示例的来源 下面概念延伸结构表示式的编号[72019-00]给出了足够的信息,请读者自己解决吧。

[*14] 此孪生兄弟说值得写一篇专文,这里从世界知识的视野讲一个要点。西方文明的核心观念——自由——是从哥哥“03”那里派生出来的,中华文明的核心观念——仁——是从弟弟“04”那里派生出来的,自由与仁的HNC本源符号就是r903和rc04。

[*15] 此语来于笔者的一首词作——千僖年再述怀(相见欢),原文是“天才乔姆 无策辨东西”。该词见本《全书》附录。

 

4.1.3概念延伸结构表示式的玄机

    从本小节开始 直至本章结束 都属于HNC理论探索的未来园地,读者可以先跳过去,直接进入本编第五章的阅读,然后再跳回来。

本小节和下一小节都使用玄机这个词语,此玄机当然有其特定含义,这是需要首先加以交代的。简单地说 这里的玄机既指模拟语言脑(图灵机)的玄机,也指人类语言脑的玄机。本小节的玄机有两种陈述方式:(1)由456株概念树所伸展出来的456个概念延伸结构表示式是否就是图灵机的基础宏观结构么?或者说 它们有资格担当起这样一个角色么?(2)人类语言脑是否存在着类似的基础宏观结构呢?或者说 语言脑理解区块的神经元聚群是否也是依据这样的基础宏观结构而组织起来的呢?神经元聚群是神经生理学早已使用的短语,近20年多来 大脑皮层柱这个术语被经常使用,新出现的神经计算学更是如此。故下文有时也以皮层柱或皮层柱组替代神经元聚群这个短语,但其意义并不完全等同于神经学所给出的各种定义。

上列两种陈述在文字上表现为两个疑问,不过 在本《全书》的已有论述里 已经多次对这两个疑问给出了明确的答案,不妨统名之HNC答案。但是 这个所谓的HNC答案实质上并不是那么确定,也许使用“根本就没有确定”的说法更符合读者的感受,故退而求其次而名之玄机。玄机者 不那么容易把握之机遇也,存在众多疑团之机遇也。

所谓“概念延伸结构表示式玄机”有玄机1和玄机2的区分,玄机1对应于图灵机,其正式名称是图灵机玄机;玄机2对应人类的语言脑,其正式名称是语言脑玄机。下文将分别依托玄机1就玄机2进行论述。这里的论述将采取列举疑团并给出简要说明的形式,不像专家的论文那么严谨,就当作一种低级形态的论文吧。

在玄机的陈述里两次使用了“基础宏观结构”的短语,这里的“宏观”是指横向与纵向延伸的基本架构,这意味着将抛开或暂不考虑该架构的某些细节;“宏观”前面的“基础”不太容易用自然语言来解释,权且把它理解为“延伸概念”这个词语的“ug”[*01]吧,这意味着将抛开或暂不考虑联系于每一延伸概念的概念关联式。延伸概念本身虽然可以提供比自然语言词语更丰富更确定的意义,但如果没有相应概念关联式的配合,即使其HNC符号再漂亮、再传神,它大体上仍然只是一个无机数据,而不是有机数据。这些话显然属于下一小节甚至是下一章的预说,可以不放在这里,但又觉得需要在此处预说一声,这里有不得不如此颠三倒四的苦衷。

专家通常都回避玄机之论,但HNC不回避。这里是本《全书》的首次玄机论,可以看作是嗣后一系列玄机论的演习。遗憾的是 这个演习式玄机论十分形而上,不过 这个遗憾后面会有所弥补,请等待两后论(指本卷第六和第七编)的正式论述吧。

玄机1和玄机2将分别标记成A1和A2,以便与延伸概念玄机(下一小节)的相应标记B1、B2相区别。玄机A1与的主要疑团如下:

疑团A1-1:自然语言处理信息过程需要调用相关概念树的概念延伸结构表示式么?该调用将简称整体调用。

疑团A1-2:整体调用的激活因数是什么?

疑团A1-3:自然语言信息处理过程3大劲敌的征服和15支流寇的肃清需要概念延伸结构表示式的协助么?

疑团A1-4:显记忆的生成需要概念延伸结构表示式的协助么?

4项疑团可合称A疑团,可以看作是HNC疑团的范本,这一特定范本的表层依据是:随后的玄机A2、B1和B2都存在类似疑团,深层依据则是:四者囊括了自然语言信息处理面临的核心科学问题。

疑团A1-1的当前答案只能是:难说!面对那“第一”核心“宫殿”(指作用效应链)全部共相概念树的繁杂景象 面对那“第二”主体“宫殿”(指第二类劳动)多数概念树的壮丽景象 除了“难说”二字 还能说什么呢?这“难说”二字来于对概念延伸结构表示式的一种感受,而感受不能没有相应的感性认识,因此 下面就来管窥以下那主体“宫殿”的壮丽景象吧。

 

表:主体“宫殿”壮丽景象之“管窥”

   

概念树          HNC表示    一级延伸概念

      制度与政策      a10        a10:(t=b,m,e2n,3;)

      政权活动        a11        a11:(e1n,3,t=b,i;)

      国家治理与管理  a12        a12:(t=a,3,i,\k=3,7;)

      政治斗争        a13        a13:(e3n,α=b,e2m,e2n,\k=2,3,i;)

      外交活动        a14        a14:(3,t=b,\k=4,m;)

          征服与控制      a15        a15:(e0n,\k=3,t=b;)

 

这组概念树(辖属于概念林“政治a1”)的一级延伸概念最少3项,最多7项。而且 每株概念树都拥有本体延伸,那株一级延伸项最少的概念树a15实际上拥有7项一级延伸[*02],那株一级延伸项最多的概念树a13实际上拥有11项一级延伸。依据动态记忆的“魔数7±2”原理[*03] 整体调用对于主体“宫殿”概念树是不可取的。当然 第二核心“宫殿”(指基本概念)和多数附属“宫殿”概念树的景象并不那么繁杂或壮丽,但问题在于 概念树景象的繁杂或壮丽与否或许可以作为能否施行整体调用的技术依据,但不能作为作出该项决策的科学依据。因此 关于疑团A1-1的现状可以这样来表述:它依然是一个原封不动的疑团。

疑团A1-2似乎是一个浮萍式的疑团,如果整体调用可能都不需要,那就谈不上什么激活因数了,皮之不存,毛将焉附?但是 如果仅仅这样想 那就多少有点“一竿子”的意味。概念树的概念延伸结构表示式是一个整体,其一级延伸概念如同一个组织的“最高领导层”,“管窥”的意思不仅是指只窥测了一片概念林,也指只窥测了其“最高领导层”。一株概念树就相当于一个组织,上文戏称“宫殿”,语境概念树是主体“宫殿”,多数专著属于特定主体“宫殿”的描述,少数专著属于某些或特定核心“宫殿”的描述,个别专著仅针对附属“宫殿”的描述。至于论文的描述对象 不过是局限于“宫中之殿”或“殿中之宫”而已。要读懂科技方面的专著或论文 需要世界知识和专家知识,但以后者为主。但人文社会学的专著、论文或命题是另一回事,媒体文更是另一回事。另一回事者 读懂它们的第一前提条件发生了重大变化也;重大变化者 世界知识比专家更为重要甚至远为重要也。没有多少人真正读懂了亚当•斯密先生的《国富论》,没有多少中国人真正读懂了毛泽东先生的著名三论[*04],更没有几个人真正读懂了邓小平先生关于“科技是第一生产力”的名言或命题[*aa]。这些“读不懂”的根本缘由并不是由于专业知识的不足,而主要是由于世界知识的欠缺。

每株语境概念树的一级延伸概念是其世界知识的集中表述,浓缩了该特定领域世界知识的要点或精华。对这些世界知识需要一个整体的把握,可名之体思,体思才能形成体说。体思之下还有面思、线思和点思,与面说、线说和点说相对应。四思之说可简化为点线之思和面体之思的两分说,对专著和论文的阅读和理解 不仅需要点线之思,更需要面体之思。点线之思大体对应于词语和语句的理解,面体之思大体对应于段落和篇章的理解。自然语言的深层理解还往往要涉及到对语言面具性特征的揭示,此更非易事,必须依靠面体之思。那么 面体之思的需要是否就是“整体调用的激活因数”呢?答案似乎是肯定的。对疑团A1-2的探索 目前仅仅走到了这一步。

疑团A1-3表面上似乎与疑团A1-2无关,但实际上不是这个情况,联系两者的纽带就是所谓的面体之思。某些劲敌C的降伏(特别是其中深层省略)离不开面体之思,某些流寇(例如流寇xx)的肃清也离不开面体之思。这是两句话高玄度的话,请重读一遍本小节的“[*aa]注释”吧 或许可以减弱一点前一句话的玄度;再请读一下所谓的康德论断[*05]吧,或许可以减弱一点后一句话的玄度。

疑团A1-3涉及到一个重大话题——如何在自然语言信息处理(核心是理解处理)的过程中降伏3大劲敌和肃清15支流寇,可分别简称“劲敌问题”和“流寇问题”,合称“敌寇问题”。在具体说明时 “劲敌”前可能需要加上表层//深层的修饰语,其后一定要加上A//B//C的标号,“流寇”则只加标号,虽然某些流寇也有表层与深层的区分。这是“敌寇问题”的又一次预说,仅点到为止,后文将多次重说。

疑团A1-4 的答案实际上十分简明,显记忆“两套索引”[*06] 之一的依据就是语境概念树的概念延伸结构表示式,本卷第四编还有进一步的说明。那么 疑团A1-4是否算不上一个疑团呢?也许可以这么说吧,它是疑团A1里疑团度最小的疑团。

玄机2的主要疑团如下:

A2-1:语言脑里是否存在着与概念树及其概念延伸结构表示式所对应的皮层柱呢?如果该皮层柱存在,拟名之(HNC-1)皮层柱。

A2-2:(HNC-1)皮层柱被激活的前提条件是什么?

A2-3:“敌寇问题”处理如何仰赖(HNC-1)皮层柱的激活呢?

A2-4:显记忆的生成要仰赖(HNC-1)皮层柱的激活么?

3个疑团的表述似乎省略了“如果(HNC-1)皮层柱存在”这个前提语,但实际上那不是省略,而是删除了一句废话。因为在理论上 该组皮层柱必须存在,至于将来叫什么名字 那是另一个问题了;在实践方面 疑团A2-1大体有了一点眉目。

大脑研究已表明 老鼠的大脑大约拥有1000个皮层柱,人的大脑大约拥有100万个皮层柱。如果假定生理脑占有全部大脑皮层柱的一半或大半,大脑的5大区块占有其中的另一半或小半;如果再假定语言脑占有的皮层柱大约是5大区块总量的1/5左右,那么 语言脑皮层柱的数量就是10万左右了,这个数据就同(HNC-1)所给出的延伸概念总量相当接近了。

《全书》早就给出过语言理解基因在15000以下的说法,于是有人问:怎么能说“15000以下”同10万左右相当接近呢?问得好!但回答相当有趣,(1)语言理解基因数量的估算(指“15000以下”的估算)仅涉及主体“宫殿”,未包括核心“宫殿”和辅助“宫殿”;(2)该估算对本体论延伸项按“1”计算;(3)语言脑显记忆的接口需求[*09]未纳入该估算;(4)句类和语境单元的需求也未纳入该估算。因此 如果把“相当接近”改成“神机妙算”似乎也无不可,这当然只是开一个“玩笑”。但是 这个“玩笑”可以作为疑团A2-1有了一点眉目的有力证据之一,这“有力”二字用了黑体,那可是非常认真而没有一点“玩笑”的意思。

因此 疑团A2-1之“是否存在”的答案应该是没有疑义的,那就是“是”。

这个理论上的“应该是”什么时候可以成为科学意义下的“确实是”呢?这笔者就比较悲观了。

美国和欧盟都已经启动了雄心勃勃的大脑研究计划,欧盟似乎更显得雄心勃勃。然而 前文曾说过 笔者并不看好那些计划[*07],这里可以说一声“不看好”的直白依据了,那些计划的主持者都对玄机2和对应的疑团A2缺乏最起码的科学思考,这不禁使笔者联想起我国1950年代大跃进时期的大炼钢铁运动。本《全书》多次预说过:人类大脑存在5大构成(形象脑、情感脑、艺术脑、语言脑和科技脑)或5大区块,这5大构成或区块建立一个基础性东西之上,那东西曾名之生理脑。生理脑是大脑的基础,不仅仅关乎大脑,也关乎脑的其他所有部件(如丘脑、小脑、海马等)和配件(如交感神经和运动神经)。如果对生理脑和大脑的5大构成来一个“胡子眉毛一把抓”,把全世界神经学家可提供的全部数据集中起来,利用超级计算机制造出一个“虚拟大脑”,这在技术上已经是或即将是完全可行的,堪称是科技史上的空前“大手笔”。但这种“一把抓”式的“大手笔”是否有点类似于我国大炼钢铁运动中的“土高炉”呢?那也是“大手笔”啊!这话近乎刻薄,那就文雅一点吧。在笔者心目中 当下西方的一切大脑研究项目都存在着或大或小的问号,该问号的简明陈述是:技术含量比较高或非常高,但科学含量比较低或非常低。这种状态对许多研究无所谓,因为其“科学棒”[*08]的探索已十分成熟,可以直接从“技术棒”起步拔地而起。但大脑研究不行,因为其“科学棒”的探索还十分薄弱。

疑团A2-2与疑团A1-2的激活条件应该完全相同,似乎无须重复,但实际上并非如此,因为图灵脑和语言脑必然存在一系列本质区别。这是一个重大话题,笔者还是老一套,先来一小段预说。这段预说以疑团A2-2为参照 但其基本思路适用于玄机2的整个疑团A2。

图灵脑施行整体调用非常方便,语言脑就未必那么方便了,这是区别1;图灵脑可以设置一幅点线之思和面体之思的运行路线图(将简称两思路线图),那将是一个变异性不那么难以把握的东西,语言脑里可能也存在一幅类似于两思路线图的“东西”,但其变异性则十分难以把握和描述,那“东西”不仅因人而异,也因每个人面临的实际语境而异,这是区别2。我们可以列举一个更长的区别清单,但意义不大,重要的是上列两区别。两区别将成为一个专用术语,用于描述图灵脑和语言脑的本质差异。但该术语仅描述了图灵脑与语言脑的本质差异之源,完全未涉及流,那流所汇成的“海洋”是大脑之谜的关键“海区”,是科学探险尚未到达的“海区”。但大脑研究毕竟出现了一些新思考,据报道 《脑连接组》[*10]里有下面的表述:“新的脑连接组学不会在一夜之间确立。但在今后几十年里…脑连接组将会最终主导我们关于人类意义的思考。”这论断有点意思。脑连接组可以视为概念联想脉络的载体么?可以,脑连接组学可以视为HNC的同盟军么,可以又不可以,可以者 都着眼于概念联想脉络也;不可以者 前者统管生理脑和大脑的5大区块,而HNC仅关注语言脑也。

疑团A2-3的文字表述似有偷梁换柱之嫌,“敌寇问题”是图灵脑带出来的问题,语言脑存在这个问题么?这三个小句似乎很有趣,实际上很可悲,因为那是“一竿子”思维的趣味。这里只想再次强调一声 “敌寇问题”是一个关乎语言脑奥秘的根本问题,而“如何仰仗”又是该问题的要害。“如何仰仗”的论述将集中安排在本卷的第三编(论语境单元),“敌寇”本身面貌的叙述则将集中安排在本卷的第五编(论机器翻译)。按常规 “敌寇”应叙述于前,而“如何仰仗”应论述于后,但本《全书》却作出如此颠三倒四的安排,这是它的宿命。上述安排是一个很好的实例[*11],故总序里的宿命说又被罗嗦了一遍。

    疑团A2-4的文字表述显然不够严谨。显记忆有多种类型,不是所有类型的显记忆都需要仰仗(HNC-1)皮层柱,但主体显记忆毫无疑问应该仰仗,理由全同于A1-4。又是一个“应该”,最终的论述请等待“论记忆”编吧。

    本小节就此戛然而止。

 

注释

[*aa] “科技是第一生产力”乃是“‘资本+技术’是第一生产力”命题的包装表述(或强语言面具性表述),该命题是《国富论》的精髓,堪称整个工业时代发现的众多命题中最伟大的一个。“未真正读懂《国富论》”者 不知此命题也(因为斯密先生并未明说),更不知斯密先生乃提出此命题之第一人也。斯密先生深知该命题必将带来严重的不良社会效应,所以 他花费更多精力撰写了另一部专著——《道德情操论》,斯密先生的这一深苦用心历来为西方政治经济学和法学所严重忽视,所以 法治崇拜者总是对德治说嗤之以鼻。邓小平先生重新发现了该命题的伟大价值,但基于中国的特殊国情 他不得不采用该命题的简化表述或包装表述——“科技是第一生产力”,“猫论”、“摸论”、“不争论”、“先富论”和“硬道理论”都不过是该包装表述的包装品。不明此语境奥妙者对诸“论”的诸多评说也许专业水平并不低,也不乏精彩的文字,但在世界知识的视野里 那差不多都是典型的低级点说,低级者 对资本和资本主义都不知加以区分也。

[*01] “ug”的含义请参阅“五元组的组合特性”节([310-23]),该符号用于此处非常传神,想找出一个合适的自然语言词语来替换它比较费劲,干脆就不找了。

[*02] 这里出现了“3 =: 7”的灵巧数值等式,下面还有“7 =: 11”,这已在前文有所说明,见本章的“4.1.2.1关于横向延伸的透齐性”。

[*03] 该原理是心理学家乔治•米勒先生于1956年提出来的。

[*04] 三论指《新民主主义论》、《论联合政府》和《论人民民主专政》。

[*05] “康德论断”的说明,见

[*06] 显记忆的“两套索引”说已预说于…

[*07] 见“概念和概念基元都需要采取灵巧式定义”小节([310-112])。

[*08] “科学棒”是指“大四棒接力”说——科学-技术-产品-工程——的第一棒,其简明论述见…

[*09] 语言脑显记忆本身的皮层柱需求应纳入生理脑的范围,所以 这里使用“接口需求”的短语。

[*10] 《脑连接组》是麻省理工学院的一位计算神经学教授的新著,在往日 它必将激起笔者“先睹为快”的巨大激情,但这种激情在发现(HNC-3)和(HNC-4)以后的10年前即开始衰退,如今已接近于消失矣。

[*11] 这个实例可能让多数读者如堕五里雾中,请等待“论记忆”编的具体说明吧。

 

4.1.4延伸概念的玄机

本小节要说的第一句话是:延伸概念玄机(玄机B)要比概念树的概念延伸结构表示式玄机(玄机A)玄得多,因为玄机A的论述总算找到了一个切入点——皮层柱,该切入点关乎大脑皮层柱的粗略宏观结构与功能,而玄机B则找不到那样的切入点,即使将来找到了,也不能象对待皮层柱那样粗略与宏观。这里的“不能那么粗略与宏观”绝不能以“精细与微观”替代,这么一说 读者应该对玄机B之玄度的分量有所感受了。

“玄机B之玄度的分量”实际上在第一卷里已经预说过了,那就是语言理解基因氨基酸和语言理解基因的染色体这两组概念[*01]。如果说皮层柱大体可以充当玄机A的佐证,那么是否可以说 从轴突、树突(基底树突和顶树突)、突触到锥体神经元也为玄机B提供了某些佐证呢?这里不能不十分遗憾地说 差得远!玄机A的佐证(皮层柱)引出了上一小节的一大段愉快的论述,本小节就没有这样的幸运了,故下文直接进入疑团B的列举与粗说。

上文已经交代过 玄机B分B1和B2两种,前者对应于图灵脑,后者对应于语言脑。

玄机B1所对应的疑团列举如下:

疑团B1-1:自然语言信息处理是否可以离开延伸概念的空降式调用呢?

疑团B1-2:被调用的延伸概念如何被确认?

疑团B1-3:“敌寇问题”处理要仰赖被确认的延伸概念么?

疑团B1-4:显记忆的生成要仰赖被确认的延伸概念么?

疑团B1-5:本体论延伸概念与认识论延伸概念的调用方式存在差异么?

疑团B1-6:语言理解基因的染色体特征如何被运用呢?

疑团B1-7:语言理解基因的氨基酸特征如何被运用呢?

 

疑团B1的疑团数量比疑团A1多了3项,两者前4项疑团所使用的描述词语大体对应,是玄机A与玄机B的共性课题,后3项疑团是玄机B的个性课题。

下面依次对各项疑团进行粗说。

疑团B1-1的文字表述本身就存在两个“疑点”,那里的主语“自然语言信息处理”就是“疑点”1的源头,它过于宽泛。当下的主流学派根本就瞧不起疑团B1-1所提出的问题,人家就一直在走“彻底离开”之路,那会去管什么“是否可以离开”之类的可笑问题呢!不过 近年有了那么一点变化,主流学派也举起了语义旗帜[*02]。这样 把那个“过于宽泛”的主语和“是否可以离开”连接在一起就不显得那么荒唐了。

“疑点”2是指该陈述里的“空降式调用”,这里的“空降”是绕开概念延伸结构表示式的意思,所谓“空降式调用”就是对一株概念树的某一项特定延伸概念进行直接调用,既不管概念延伸结构表示式,也不管它处于纵向延伸结构的那一级。当然 一旦空降成功,那纵向延伸的级别是一清二楚的。

如果以婴超或语超为参照 疑团B1-1的答案显而易见,那就是“绝不可以离开”,这就是说 必须把自然语言的符号体系转换成语言概念空间的符号体系,也就是HNC符号体系,或者是未来的其他数字符号体系。总之 自然语言高级信息处理必须完成语言信息符号体系从此山形态向彼山形态的转换,这个论断以往已经叙说过多次,不过 这次加了一个修饰语“高级”而已。

疑团B1-1的粗说就到此为止吧。

疑团B1-2的文字表述不存在什么“疑点”,但“被确认”的意义并非如其字面意义所显示的那么确定,实际上它具有浅层和深层的不同意义。

浅层意义的被确认就是所谓的“多选一”问题。特定延伸概念的调用依靠相应词语的激活,但绝大多数词语对应于多个延伸概念,“多选一”问题自然就跑出来了。《理论》里曾对此给出过如下的表述:自然语言的词,大多数是多义的,人在言语感知过程中必须进行大量的“多义选一”处理。也许可以说,这是交谈或阅读过程中大脑里最基础、最频繁的操作。然而 这个表述具有严重误导性,因为它完全忽视了深层意义下的被确认。

深层意义的被确认不是简单的“多选一”问题,而是“灵巧选择”问题。灵巧选择又需要区分两类,一是语言学习过程的灵巧选择,可简称初级灵巧选择;二是语言运用过程的灵巧选择,可简称高级灵巧选择。

灵巧选择贯穿于语言脑的整个发育过程或语言学习过程,也可以说是贯穿于语言智力的整个成长过程。初级灵巧选择大体完成于一个人的6-7岁之间,高级灵巧选择大体完成于孔夫子所说的“三十而立”[*03]。

前文说过 智力有图象、艺术、语言和科技的4类型区分[*04],学习也应该具有相应的4类型区分。那么 上面关于语言脑灵巧选择的论述是否也适用于图象、艺术和科技脑呢?答案似乎倾向于不那么肯定,这是一个由疑团B1-2派生出来的疑惑,但这个疑惑却似乎被有关学界过于忽视了。

这里只基于疑团B1-2而提出灵巧选择的话题,并不展开论述。在那里正式展开呢?读者不妨猜猜看。

疑团B1-3和B1-4与疑团A1-3和A1-4类似,似乎可以不假思索给出答案:要仰赖。但接下来的问题是:如何仰赖呢?这就不是一个寻常性问题了,要问“路在何方”(答案在哪里?),那就也请猜测一下吧,笔者可要暂时保密了。

下面转向玄机B之3项个性课题的粗说。

疑团B1-5里有两个关键性术语:本体论延伸概念和认识论延伸概念,读者对它们应该已经不那么生疏了。延伸概念的基本类型仅此两类,这里用得上那个不能随意使用的“非此即彼”成语了,那可是(HNC1)和(HNC-1)的立论之基!前者指以第一类“氨基酸”[*05]为“端粒”[*06]的延伸概念,后者指以第二类“氨基酸”为“端粒”的延伸概念。

两者的调用方式存在差异么?此问题从何而来呢?

    “调用方式”这个短语也许不那么合适,那就请把“调”与“用”分开来吧,这样就可以说:差异不在于“调”,而在于“用”。在使用本体论延伸概念的时候,可以弱关注其小家族的其他成员;但在使用认识论延伸概念的时候 则必须强关注其小家族的其他成员。所谓调用方式的差异就是指对待小家族其他成员的不同态度:弱关注或强关注。

疑团B1-5的粗说拟到此结束,答案是显而易见的。至于关注度的强弱如何施行,那属于疑团B1-7的课题了。

疑团B1-6里的关键性术语是“语言理解基因的染色体”,仿照语言理解基因氨基酸的做法 该术语将简记为“染色体”[*05]。染色体的数量是23对,“染色体”的数量是5大类24种[*07]。对于“23”和“24”这两个数字 当然不能象粗说疑团A1-1那样 用“神机妙算”的成语来加以描述,但勉强可以使用“奇妙的巧合”这个短语吧。

当然 不能夸大这“奇妙的巧合”的启示性意义,但也不能轻视,更不能无视。为什么?因为 这24种“染色体”所蕴涵的世界知识非常宝贵,这宝贵性很特别,用现代语言来说 这些“染色体”相当于语言脑的GPS,将简称“语言脑GPS”。语言脑是一座巨大的“迷宫”,前文描述过该“迷宫”极度复杂的内墙和外墙;提到过该“迷宫”的核心“宫殿”群、主体“宫殿”群和附属“宫殿”群;多次论述过具体概念与抽象概念之间有天壤之别,挂靠具体概念和基本具体概念之间又有天壤之别;…总之 要想在那座“迷宫”里不迷路,没有相应的GPS是寸步难行的,“染色体”正是语言信息处理最迫切需要的GPS。至于该GPS的定位精度如何 那就不属于粗说的范围了。但这里不妨加上这么一句话,如果连“语言脑GPS”都不会使用,那婴超或语超(图灵机)的研发是没有任何指望的,这就是说 HNC语言信息处理必须从该GPS的使用起步。

疑团B1-7是所有疑团中玄度最大的疑团,因为迄今为止的大脑研究没有给出任何可以与“氨基酸”拉上关系的术语。有人曾把大脑皮层比作一块蛋糕,说那块蛋糕的主要奥秘藏在其表层的糖霜里,这个比方有点意思。那糖霜里也许可以找到“染色体”的标记,但“氨基酸”标记就完全是另外一回事了,因为它一定属于皮层柱的内部“微观”结构。因此 疑团B1-7的存在性似乎大有问题。该存在性的验证(证实或证伪)难度要远大于大脑的五大区块假说,因为现有的大脑观测手段也许已不难进行五大区块假说的验证,但要进行“氨基酸”假说的验证,那还差得很远。

然而 如果否定“氨基酸”假说 那人类语言脑惊人的共性呈现和更为惊人的个性呈现就会陷入解释学的黑暗深渊;反之 则不难进入解释学的明亮天堂。这就是说 “氨基酸”的总体结构与功能特征可以为语言脑的共性呈现提供充分解释,而“氨基酸”变异甚至是微小变异则可以为语言脑的个性呈现提供充分解释。这样 “氨基酸”就变成一个不必纠结或不必怀疑的存在了。

“氨基酸”变异是什么意思呢?

在概念延伸结构表示式里 “氨基酸”都以原生态的形态出现,“氨基酸”的各要素是没有任何加权的,其延伸概念所伴随的概念关联式也还没有明确的加权[*08]。然而 “氨基酸”的实际生态不可能是这样,它必然存在加权。不同种族的语言脑和生活在不同文明语境下的语言脑可能具有比较稳定的不同加权,每一个人在不同年龄段可能也有比较稳定的不同加权,而同一个人在日常生活与工作的不同语境下则可能出现动态性的不同加权。加权是“氨基酸”的固有特性,没有加权的“氨基酸”是不可思议的。带有加权的“氨基酸”才是“氨基酸”存在的实际状态,可简称“氨基酸”实态。每个人的“氨基酸”实态各不相同,其差异度应该高于面相或指纹。加权值的微小变化有可能导致“氨基酸”变异,而这种变异可能形成著名的蝴蝶效应,使得一个人的精神状态或精神面貌变得“面目全非”。“氨基酸”实态虽然千变完化,但其基本构成是不变的,正如眼睛总是眼睛、耳朵总是耳朵、鼻子总是鼻子、嘴巴总是嘴巴、眉毛总是眉毛一样,眼睛、耳朵、鼻子、嘴巴和眉毛是面相的基本构件,总称五官,“氨基酸”就是语言脑“面相”的“五官”。

上文为什么对“应该高于”四字加了黑体呢?因为每个人的面相大体上可以说只有一幅,而“氨基酸”实态的“面向”则必须说“至少两幅”。对这里的“两”很难找到相应的自然语言词语来加以描述或区分,将仿照语境单元处理背景BAC的方式 以“E态”和“A态”加以标记。这里应强调一声,如果“氨基酸”存在,那就必然有“E态”和“A态”的区分。

如果说“氨基酸”实态之“E态”和“A态”的区分基本上是一个虚无缥缈的东西,那第一类和第二类“氨基酸”似乎就不能这么说了。后文将把两者分别简写成“氨基酸-1”和“氨基酸-2”。“氨基酸-1”的主项有:“~t”、“~\k”和“~i”,“氨基酸-2”的主项有:“~o”、“~eko”、“~cko”和“~dko”。当然 对这里的说法可能存在完全相反的意见:“氨基酸”实态的“E态”和“A态”并不虚无缥缈,而“氨基酸-1”和“氨基酸-2”才真正虚无缥缈。但问题在于 这样的分歧或争论目前还不会出现,也许可以说 此类分歧或争论出现之日 就是脑科学研究新阶段开始之时,HNC期盼着它的到来。新阶段的基本标志是:不再是纯粹的“形而下//形而上”探索方式,而是两者的紧密结合。

浏览或阅读过本《全书》前两卷的读者应该有这么一个强烈的印象,延伸概念无非就是以“氨基酸-1”或“氨基酸-2”为“端粒”的复合符号,两者的上列主项更为常见。因此 对延伸概念可以给出“延伸概念-1”和“延伸概念-2”的基本区分。对“延伸概念-1” 可进而给出“延伸概念t”、“延伸概念\k”和“延伸概念i”等更细致的区分;对“延伸概念-2” 可进而给出“延伸概念o”、“延伸概念eko”、“延伸概念cko”、“延伸概念dko”等更细致的区分。对语言理解基因 可以给出如法炮制的相应描述。后文将经常使用“语言理解基因-1”、“语言理解基因-2”、“语言理解基因t”、“语言理解基因o”、“语言理解基因eko”和“语言理解基因\k”之类的术语,必要时还可以使用它们的简写形式:“基因-1”、“基因-2”、“基因o”、“基因eko”、“基因t”、“基因\k”等。带变量符号的基因还可以写成常量形式:如“基因1”、“基因e45”、“基因a”、“基因\1”等等。

前两卷曾多次使用过某“概念的符号表示非常传神”的表述,用这里引入的术语来说就是:多数“延伸概念eko”或“基因eko”是比“延伸概念o”或“基因o”更宝贵的宝贝;“延伸概念β”或“基因β”、“延伸概念e4o”或“基因e4o”、“延伸概念e2ne2n”或“基因e2ne2n”等最为宝贝,简直就是语言信息处理的法宝。

现在我们可以说 “基因-1”和“基因-2”的“面相”差异很大,后者的“面相”一目了然,前者不是。有人问:“基因-1”里的“基因β”例外吧,其“面相”不是很特别么!但这个特殊“面相”是其小家族的整体特征,只标记在概念延伸结构表示式里,从该小家族的个体成员身上是看不到的。

假定这里所说的“氨基酸”在语言脑里确实存在,那么 它们所依托的载体和物质是什么呢?如果回答说:那载体是某种类型神经元组,那物质是某种类型的荷尔蒙,那无疑是两句典型的废话。但是 该废话里的“某种类型”却是疑团B1-7的“大场+急所”,HNC的未来探索不能回避,大脑的语言脑研究也不能回避。

有了上面的铺垫,下面可以回应“疑团B1-5”的最后一句话了,这个回应实际上也就是对“疑团B-7”的粗说。

在“疑团B-5”已经说过 对“基因-1”的小家族成员可以弱关注,对“基因-2”的小家族成员必须强关注。弱关注的意思是可以不理会小家族的其他成员,强关注的意思是必须理会小家族的全体成员。由于“基因-1”与“基因-2”的符号特征一目了然,关注度施行的强弱把握似乎已经迎刃而解,但实际情况并非如此,因为“基因-1”里的“基因β”也应该予以适度的强关注,这是“疑团B-7”必须面对的第一项课题(“课题1”)。

    “氨基酸”也可以按其是否具有分团[*10]特性而分为两类,具有典型分团特性的“氨基酸”是:“氨基酸cko”、“氨基酸dko”和“氨基酸eko”,三者都属于“氨基酸-2”。“基因”可以如法炮制而分为两类:分团“基因”和非分团“基因”,分团“基因eko”里的一部分(如“e4o”、“e0o”等)是语言信息处理的法宝,前两卷里曾对此不厌其烦地加以强调。因此 如果不对分团型“基因”加以特殊照顾,那就是“一竿子”思维的典型犯傻了。那么 怎样对分团“基因”作灵巧处理呢?这是“疑团B-7”必须面对的第二项课题(“课题2”)。

本《全书》前两卷所描述的全部延伸概念都只是“基因”的原生态,然而 语言信息处理过程所面对的 并不是“基因”的原生态,而是“基因”的实态,即“基因”的加权形态,这是任何高级自然语言的必然具有的基本特征。任何文本都携带着写者[*11]加权“基因”系统的印迹,该文本在读者的语言脑里形成显记忆时 又一次被注入读者加权“基因”系统的印迹。当写者与读者的加权“基因”系统比较接近时,共识或共鸣将成为主流,读者将扮演追随者或支持者的角色;当写者与读者的加权“基因”差异较大时 歧见将成为主流,读者将扮演反对者或质疑者的角色;当然 多数情况应介乎两者之间,这时的读者主要是充当一位学习者。这就是说 语言脑不仅是一个学习者,也是一个追随者或反对者,这一点 也许是语言脑的本质特征,将命名为“三角色”(学习者、追随者和反对者)特征。这个特征也许可以勉强用于描述生理脑和情感脑,但基本不适合于描述艺术脑和科技脑,更不适合于描述图象脑。

“三角色”特征对应于语言脑符号系统里的什么东西呢?撇开化学和生命学 这个东西的答案似乎反而显得不那么神秘和复杂了。那东西不是别的,就是“氨基酸”的加权形态,也就是“基因”的加权形态。这就是说 没有“基因”的加权形态,就没有“三角色”特征。那么 如何实现“基因”的加权形态呢?这是“疑团B-7”必须面对的第三项课题(“课题3”)。

语言脑的“三角色”特征是一个新的说法,前面的许多论述都参照了这个说法,某些概念树[*12]及其概念结构表示式的设计也参照了这个说法,所以 下面写两段辩护性的文字。

“三角色”特征是语言脑的天生特性,婴儿的语言脑已经具备“三角色”的潜质,但不能进行“三角色”的正式演出,顶多是低级形态的片段演出。语言脑的“三角色”正式演出有一个长时间的排练过程,最初是作为学习者的排练,接着是作为追随者的排练,随后是作为反对者的排练。当然 “学习-追随-反对”并不是一个截然分离的三步曲,而是一个螺旋式上升的协奏曲。不过 该协奏曲依然存在着三者各自为主的三阶段,先是以学习为基调的婴幼年阶段,接着是以追随为基调的小少年阶段,再接着是以反对为基调的大少年阶段。“而立”之年前后 才逐步进入以“追随//反对”为基调的“三角色”正式演出阶段。

脑科学主流学派之一(也许可名之哈佛学派)有一个著名的说法(见《破译大脑之谜》p42):人的大脑大致在24岁时发育成熟。动物实验证明,寿命是脑成长发育期的6倍,因此 人的寿命应该是144(24×6)岁。以语言脑的生理特性为参照 笔者没有理由质疑这个说法,但如果以语言脑的心理特性为参照,则笔者对这个说法实在不敢恭维,特别是其中的第一句话,生理脑的发育成熟显然不需要24岁,而语言脑的发育成熟在24岁左右时显然不够。这里再强调一次吧 生理脑、图象脑、情感脑、艺术脑、语言脑和科技脑的明确区分是至关重要的,当下的脑科学研究完全没有意识到这一区分么?当然不是。但认识的深度不够,甚至可以说是远远不够。“人的大脑大致在24岁时发育成熟”的说法是一个证据,“人脑的每侧半球有52个布劳德曼区”的描述(见《大脑如何思维》p105)是另一个证据。

“疑团B-7”的第四项课题(“课题4”)涉及“基因”的“E//A态”表现,该表现是语言面具性的基本缘起。语言面具性不仅是写者的“喜好”或“惯性”,也是读者的“喜好”或“惯性”,而这种“喜好”或“惯性”的符号展现可以归结为“基因”的动态加权。前文曾提及 婴超可以充当语言脑研究的“电子白老鼠”,制作该“白老鼠”的基本手段就是对“基因”施行“课题3”所设想的“基因”个性加权和本课题所设想的“基因”动态加权。

“基因”个性加权的基本特征是它的稳定性和内在性,“江山易改,本性难移”里的本性就是指每个人的“基因”个性加权;“基因”动态加权的基本特征则是它的随机性和外在性,“怒不可遏”、“乐以忘忧”、“谈虎色变”、“心潮澎湃”、“提心吊胆”等都是“基因”动态加权的表现。

“基因”动态加权可简称动态“基因”,“基因”个性加权可简称个性“基因”,两者之间一定呈现为源流关系,个性“基因”是源,动态“基因”是流。上列关于动态“基因”的示例都属于第一类精神生活,但应该指出,这两种“基因”都存在于三类精神生活和两类劳动,不过 在第一类精神里的表现最为突出。

作为“电子白老鼠”的婴超将是研究个体“基因”和动态“基因”的绝妙平台,请充分想象一下这个平台的妙用吧,但千万不要把其潜在商业价值的估量放在第一位。

 

结束语

    本节是本章的重点或主角,后面的三节是配角,但绝不是可有可无。不过 它们的撰写将安置在机动时间里。

 

 

注释

[*01] 语言理解基因氨基酸和染色体是HNC的两个关键概念或术语,其第一次预说见本《全书》第一卷里的“誓愿行为(537301\21)的世界知识”([123-01215]孙节)。实际上 两者在《理论》阶段已经产生,不过当时十分纠结于“招摇过市”的顾虑,故仅在口头上轻描淡写地提起过,未敢付诸文字。

[*02] 前文曾对“语义旗帜”有所评说,见本编的“概念基元不是语义基元或概念节点”([310-111]小节)。请注意 在疑团B1-1的陈述里 并没有使用语义这个术语,而是用延伸概念的术语替换了它。

[*03] 这个说法最早是在隐记忆联系的论述中提出来的,见…

[*04] 智力的4类型区分说见“理性行为7322的概念延伸结构表示式”分节([123-22-0]),从章节编号可知 那是一个直接隶属于概念树之概念延伸结构表示式的分节,这样的分节一般是不安排世界知识论述的,但该分节被赋予了十分罕见的特权,以大段文字从事世界知识的论述,这在本《全书》里属于十分特殊的安排。为什么要这么做呢?为了突出所论述世界知识的特殊重要性。当然 那株概念树是经过精心挑选的,叫“行为与理性7322”,简称“理性行为7322”。所谓“特殊重要的世界知识”就是指智力的4类型区分:语言智力、图象智力、艺术智力区块和科技智力,原文如下:大脑存在下列五个结构与功能区块——语言智力区块、图象智力区块、艺术智力区块、科技智力区块和情感区块,下文将简称大脑五区块。前4个区块应该分别代表4种不同类型的智力,所以都加了智力的修饰语,但情感区应该弱关联于智力,故未加

[*05] 这个带引号的“氨基酸”就是“语言理解基因氨基酸”的简写,下文的“染色体”同此,带引号的“基因”则是“语言理解基因”的简写。

[*06] 端粒是细胞学的一个术语,位于蛋白质内DNA的末端。近年发现:其长短或大小乃是细胞生命力的标志。这里的带引号“端粒”是借用。

[*07] 见本注释[*01]所引章节里的“表B:语言理解基因染色体的符号表示”。

[*08] 概念关联式曾被赋予不同类型的编号,那是加权的一种尝试。

[*09] 符号“~t”就是“氨基酸t”的简写,下同。这是从《现汉》学来的表示方式。“氨基酸1”里的“~t”有“~α”、“~β”和“~γ”三种变异形态,“~\k”里有“~\0”的变异形态;“~i”里“~3”和“~7”的变异形态。“氨基酸2”里也有相应的变异形态,就不一一列举了。

[*10] 分团是从神经生理学借用的术语,《大脑如何思维》的作者曾以“分团、排序和达尔文过程”为基本依托描述思维的基本特征,见该书的p79。

[*11] 这里的写者可改成“写者或说者”,后面的读者可改成“读者或听者”,但HNC理论目前不打算跨过这个界限,仅满足于写者与读者。把说者与听者拉进来 理论上不会带来多少重大原则性问题,但在技术上会带来一系列新问题。从这个意义上说 HNC理论不过是一个“后天失聪者”的语言脑理论。

[*12] 此类概念树在三类型“宫殿”里都有,核心“宫殿”群的典型代表是“反应02”和“支持与反对43”;主体“宫殿”群的典型代表是…

 

 

          第三卷 第一编 第四章 第2节 横向延伸的齐备性探求

 

 

          第三卷 第一编 第四章 第3节 纵向延伸的透彻性探求

 

 

          第三卷 第一编 第四章 第4节 挂靠的哲理描述

 

 

 

第三卷 第一编 第五章 概念关联式

 

引言

    概念关联式用于描述概念之间的内容逻辑关系。每一个概念都拥有自身的一组概念关联式,没有概念关联式的概念是不存在的,或者说 是HNC理论不予考虑的。可以打个比方说:若概念对应于神经元,则概念关联式即对应于突触,每一概念之拥有众多的概念关联式 如同每一个神经元拥有众多的突触。但这个比方又是很不恰当的,这首先是因为概念与神经元不可直接类比,其次是因为概念关联式与突触的数量也不可类比。

概念有延伸概念(EC)、概念树(CT)、概念林(CF)和概念范畴(CC)的基本区分,它们都各自拥有自身的概念关联式,但这4种类型的概念并不构成概念关联式的4类型区分,这是需要首先明确的。概念关联式的类型将按其内容逻辑的连接特征加以区分。

上一章讨论过“基因”的原生态和实态(加权形态),还提及“基因”实态的“E//A”表现。概念关联式也存在类似问题——概念关联式的形态。

上述两点概括了概念关联式的基本课题,因此 本章仅设置下列两节:

1:概念关联式的类型描述

2:概念关联式的编码及标记

 

 

第三卷 第一编 第五章 第1节 概念关联式的类型描述

 

本节将设置两个子节。子节1描述概念关联式的常见类型,子节2描述概念关联式的基本类型。

 

5.1.1 概念关联式的常见类型

概念关联式的常见类型以特定符号加以表示,这些特定符号如下表所示:

    

       表:概念关联式的10个特定内容逻辑符号

 

          符号       汉语说明

          =          强交式关联于

=>         强源式关联于

<=         强流式关联于

         强关联于

              :=         对应于

              ==         虚设

              =:         等同于

              %=         属于

              =%         包含

              ::=        定义为

       

下面对这10个符号作简要说明。

    (1)符号“=”表示两概念之间存在足够大的交集,“足够大”当然是一个模糊的说法,然而也是一个灵巧的说法。数理逻辑的交集符号未计及“足够大”,使用起来就容易造成误会了,故未使用原有的交式关联符号,并在汉语说明中特意加了一个“强”字。

    (2)符号“=>”和“<=”表示两概念之间的源流关系,即通常所说的因果关系。但应该指出 任何一个概念既是众多其他概念的因,又是众多其他概念的果。因与果都具有众多性,不存在唯一性[*01]。在众多的因果之中 必有主次之分。这两个符号描述的是主要原因或主要结果,不管哪些次要的东西,故其汉语说明中也特意加了一个“强”字。

3)符号“≡”表示两概念之间存在着最大的交集和最强的因果关系。从交集的意义说 其相交度显著大于“=”,甚至可以完全重合,但又绝不可名之孪生概念,因为两者一定分别属于不同的母体——概念树。从因果性来说 两者互为因果,形影不离,有此必有彼,有彼必有此。这就是说 两者之间将呈现出最强的概念联想脉络。

4)符号“:=”表示两概念之间具有明确无误的对应关系。如果说 前面的4项逻辑符号主要是为了揭示主块之间的关联性提供世界知识,则本逻辑符号则主要是为了突显辅块(背景)的相关信息提供世界知识。

5)符号“==”的汉语命名叫虚设,是HNC符号体系设计里的一项特殊措施,这需要写几句回顾性的话。关于(HNC-1)符号体系设计的指导原则 在HNC探索的三个阶段曾给出过不同的说法,《理论》阶段叫四项原则:尔雅原则、语境原则、关联原则和延伸原则;《定理》阶段扩展为五项原则,增加了一个句类原则;《全书》阶段再扩展为六项原则,再增加一个平衡原则。虚设是实现平衡原则的措施之一。

按照原来的设想 虚设只针对延伸概念,不虚设概念树。但后来打破了这一设想,安置了两株虚设概念树,一是“记忆805”。二是“经济与军事a29”。前者可视为概念林“联想q80”的虚设,也可视为概念树“记忆q801”的虚设;后者则仅仅是概念树“军事与经济a47”的虚设。

    (6)符号“=:”表示两概念之间的等同性,此等同是语言意义的等同,而不是数学意义的等同。此特定内容逻辑符号不仅服务于语言理解,也服务于语言生成,这是它的独特性,因为其它的9个特定内容逻辑符号都主要服务于语言理解。

7)剩余的3个符号都是对已有逻辑符号的完全借用,不过 三者的借用方式有所不同。最后的一个未改换符号形式,前面的两个则改换了,这仅仅是为了笔者键击的便利,没有任何其他的意思。

    大多数概念关联式都需要使用上列内容逻辑符号,本小节的命名即来于此。

 

5.1.2 概念关联式的基本类型

本编的编首语曾给出过概念关联式的“定义式(CPm,L,CPn)”。这里要补说4点,(1)如果该定义式里的“L”使用上列特定内容逻辑符号,则其中的小括号和逗号都可以取消,该定义式就变成了一个逻辑表示式。(2)如果不使用上列特定内容逻辑符号,该定义式所表达的就是一个复合概念,这就是说 所谓的“复合概念”其实就是概念关联式的一种呈现,或者说 所谓“概念关联式的基本类型”其实就是指各种类型的复合概念。(3)该定义式里的概念基元本身又可以是复合形态。(4)一个概念关联式——无论是逻辑表示式或复合概念——实质上就是一个命题。

以上所说 这是对“定义式(CPm,L,CPn)”的正式解释或说明,也算是一种灵巧式解释或说明吧。

“定义式(CPm,L,CPn)”是一种数学表示式,在具体应用时要变成相应的物理表示式,那就是把其中的“CP”以“表:语言概念空间的第一基本景象”里所描述的概念(包括它们的延伸概念)加以替换,把其中“L”以该表里的逻辑概念加以替换。第二项替换在HNC探索历程中 经历过一个明显的三步曲(三阶段)。

《理论》阶段主要是对词语组合结构以往过于陈旧的描述(虽然它必将继续强存在)进行反思,用概念组合结构替换了词语组合结构,提出4类组合结构——作用效应类、对象内容类、逻辑类和语法类——的说法(见《理论》p40),以往对词语组合结构的主体性描述被包装在语法类里。前两类代表着HNC的两项新思考,第三类是对以往关于词语组合结构辅助性描述的提升。可惜 当年的第一项新思考并不透彻[*02],而提升的视野也比较狭窄[*03]。

《定理》阶段深化了上述第一项新思考,这仰赖于从狭义作用效应链到广义作用效应链的跃变,这使作用效应链的概念达到了透齐性高度,同时也使第一项新思考达到了这一高度。该阶段还扩展了提升的视野,使“lm”不再局限于“l1”,而扩展到整个语法逻辑“ly”。

《全书》阶段全方位扩展了逻辑组合的视野,将“(,lm,)”扩展为“(CPm,L,CPn)”,于是 四大类内容逻辑符号都可以进入符号“L”。这样 复合概念的描述终于达到了“募然回首”境界的圆满结局。

 

 

            第三卷 第一编 第五章 第2节 概念关联式的编码及标记

 

本节应说明下列课题,但实际上将仅仅交代一些细节。有关课题的名称如下:

课题1:概念关联式的编码

课题2:概念关联式的内容标记

课题3:概念关联式的特殊标记

课题4:概念关联式的加权标记

 

《全书》概念关联式的编码现状非常混乱,2010年以前撰写的部分都只给出了概念关联式的临时性编码,目的仅在于为“当地”世界知识的撰写提供便利。此后 才逐步认识到概念关联式编码的重要性,但并未立即制定一个相应的编码“规范”。即使在今天 笔者也不打算在这里写出一个规范性说明,缘由就不解释了。

下面给出一组带编码的概念关联式[*04]

73228<=q811——(7322-1a)

  (先验理性行为强流式关联于理性想象)

    73229<=q801——(7322-1b)

    (经验理性行为强流式关联于记忆)

    7322a<=q812——(7322-1c)

    (浪漫理性行为强流式关联于幻想)

    7322b<=q813——(7322-1d)

  (实用理性行为强流式关联于迷信)

  (73228,jlv00e22,7301\03*t=b) ——(7322-0-1)

  (先验理性行为无关于三争心态表现)

(73219,l83,(8111,l45,a30it))——(7321-0-1)

    (理想行为基于全部文明基因的综合)

(7321a9,lv00*139e26jlur12e21,(China,s31,[20]pj12))——(7321-0-6)

    (交织于理念的信念行为曾风行于20世纪的中国)

(s109\4*d01 <= a0099t,t=b)——(s1-01-0)

(功利性路线强流式关联于三争)

 

示例的编码形式有两种:无秩与有秩。示例共计8个概念关联式,前4个是无秩编码,后4个是有秩编码。

无秩与有秩编码的具体形式如下:

    ——(数字串-数字串//数字字母串)

——(数字串-0-数字串//数字字母串-0)

前者叫无秩编码,后者是有秩编码的满秩形态。

居于首位的数字串乃是所描述概念HNC符号的拷贝,叫内容标记,居于第三或第二位的“数字串//数字字母串”叫编号;居于第二位的“-0-”叫特殊标记;居于后位的“-0”叫加权标记。

特殊标记和加权标记都选用了数字“0”,此“0”相当于道家的“无”和佛家的“空”,何意?留给后来者做文章耳。

特殊标记的含义曾给出过详尽说明,但不必查阅,这里重说一次吧。上文已指出 一个概念关联式就是一个命题,而命题就必然存在“E态”与“A态”之别,有特殊标记者 概念关联式之“A态”也;无特殊标记者 概念关联式之“E态”也。

 

 

注释

[*01] 这仅仅是一个说法,而不是一个命题,请勿深究。

[*02] 第一项新思考是对动词及物性和不及物性之形式两分描述的反思,以作用型与效应型之句类两分描述替代之;第二项新思考是对“主、谓、宾”之传统三分描述的反思,把它改造成“E、A、B、C”的四分描述,此项改造的关键举措可以说就是把“宾”分解为“对象B”和“内容C”两者。

[*03] 这里“视野比较狭窄”的说法主要指符号“(,lm,)”所代表的内容,当年的“lm”偏重于概念林“l1”。

[*04] 本示例列举了8个带编码的概念关联式,它们分别来自本《全书》的3个不同处所,但不加指引,因为读者不难从其内容标记找到它们的出处。

 

小结

 

 

第三卷 第一编 第六章 语言理解基因

 

引言

 

 

 

(未完待补)