把文字数据变成文字记忆

黄曾阳(090913)

 

摘要:

本文论述了把文字数据变成文字记忆的三点基础性思考。第一点是关于语言记忆与语言理解关系的略说,以记忆公理和理解基因的概念为立足点,仰望了记忆与理解的互动性;第二点是关于记忆模式和记忆样式的略说,以显记忆-隐记忆-动态记忆和共相记忆-殊相记忆等概念为立足点,仰望了语言记忆的两种模式和两种范式;第三点略说了文字记忆技术实现的三大战役——机器翻译、一目千行和智力培育。

    上述一系列作为立足点的概念是HNC理论必然衍生出来的新概念,形成已久。不过 多数是第一次公开出现,但在HNC团队内部 曾以相同或不同的名称使用过多年了。

    相对于第三届HNC与语言学研讨会而言 这次仰望是悲观一些还是乐观一些?应该是兼而有之吧。

关键词:   理解基因  隐记忆  记忆公理

 

总目录

00 引言

01 语言记忆与语言理解

02语言的记忆模式与记忆样式

03 语言记忆工程的三大战役

05 结束语

 

引言分目录

00-1信息转换的低级与高级形态

00-2大脑硬件的基本特征

00-3 关于大脑软件基本特征的设想

00-4 准备迎娶“昭君”

 

00-1信息转换的低级与高级形态

20世纪众多的科技明星中 粉丝最多的一位叫“数字化”。数字化就是把各种形态的信息统一转换成数字形式。数字化是一位女明星,数字化是她的艺名,其学名应该是“信息转换的低级形态”或“低级信息形态转换”。

这位女明星尚未出嫁。这里预告一声 其未来夫婿的艺名叫“智力化”(包括智能化)。“智力化”的核心科学问题之一就是把数据变成记忆,这也是信息形态的一种转换。但这一转换的层次显然远高于数字化转换,故名之“信息形态的高级转换”或“高级信息形态转换”。

我们已经看到 “低级信息形态转换”(数字化)已经造就了多么壮丽的信息产业数字化辉煌,那么 “低级信息形态转换”与“高级信息形态转换”(智力化)的结合(结婚)将会造就什么样的信息产业辉煌呢?能不能说 这是两种具有天壤之别的辉煌呢?

 

00-2大脑硬件的基本特征

表面上看 似乎大脑的硬件(大脑皮层的生理结构)已经搞得相当清楚了,大脑的软件(大脑皮层的智力运作过程)也有诸多发现[1]。然而 问题在于大脑之谜的探索需要硬件与软件并举的思考,而这种思考是很欠缺的。

大脑的硬件似乎可以同计算机进行类比,划分为I/O(接口)、CPU和MEM(内存与外存)这三个基本环节。但是 计算机的CPU目前根本不存在语言、图象、艺术、科学和情感范畴区分,而大脑的CPU肯定存在着这样的范畴区分,这区分 体现了大脑CPU的基本特征。这个命题很重要,可惜还没有获得应有的重视。

 

00-3 关于大脑软件基本特征的设想

大脑的软件似乎也可以同计算机作某种类比 划分为自我操作和对外服务两个侧面。前者密切联系于CPU+MEM,后者密切联系于(I/O,MEM,CPU)。

大脑的操作软件有什么不同于计算机的本质区别?

HNC的答案是:大脑操作软件存在着智能与智慧的基本差异。这里不来介绍智能与智慧的定义及其HNC符号表示式,只用一个例子来表明两者之间的巨大不同。柏拉图与孔夫子、恺撒与拿破仑都智力超群,但两位夫子和两位将军的具体智力表现可大不相同,能不能说“两位夫子智慧超群而智能平平,两位将军智能超群而智慧平平”呢?好象是可以这么说的,可见 智力存在着智能与智慧的本质区分。孔夫子正是由于智能平平而于最近引出了“孔子,丧家犬”的命题,这命题受到许多学者的盛赞。但问题不在于盛赞或反对,而在于对先哲的基本态度。柏拉图经历过与孔子极为类似的境遇,但希腊人和西方人绝不会把丧家犬之类的侮辱性描述加到柏拉图身上。尼采先生确实喊出过“上帝死了”,但绝不会超出这个限度而高喊“打倒上帝”。

数据和记忆是两种性质截然不同信息载体。数据仅涉及信息的量与形式,不涉及信息的质与内容,无关于智能与智慧的差异;记忆则不仅涉及信息的量与形式,更涉及信息的质与内容,有关于智能与智慧的差异。可见 记忆所要求的信息形态转换 其难度必远大于数据。作为一项科技课题 “高级信息形态转换”的命运非常奇特,很像那位出塞前的王昭君。

 

00-4 准备迎娶“昭君”

可是 命运类似于王昭君的“高级信息形态转换”并不是“昭君”,而是“昭君”的未来夫婿。

上面说到的那位数字化美人才是“昭君”,她还没有找到如意郎君。上帝似乎似乎在刻意安排一场年龄差距破历史记录的姐弟恋。那位美人的芳龄已经超过了30岁,可是那位未来的新郎还没有出世。他以胎儿的形态已经诞生多年了,但没有降生。最近的检查表明,胎儿发育正常,主要问题是母亲营养不良。预产期还没有完全确定,乐观的估计是2012年。即使有这样的喜讯,迎娶昭君的盛事我这个老头子肯定是赶不上了,但在座诸君应该都能赶上。不过 能在这个研讨会上想象一下从“昭君出塞”到“迎娶昭君”的历史巨变,已经是足够欣慰的事了。

 

 

语言记忆与语言理解分目录

01-1 语言记忆公理

01-2自然语言符号体系和语言概念空间符号体系

     ——为什么训诂学大师们看不起《马氏文通》

01-3语言概念空间符号体系与语言理解基因

01-4语言理解基因的自然语言表述

01-5语言记忆贯穿于语言理解过程的始终

 

01-1 语言记忆公理

记忆公理1:记忆必须以某种符号形式存在于大脑的某一特定区域(例如海马),语言记忆使用的符号绝不是语言符号的拷贝,而是语言符号的某种变换形态

    记忆公理2:语言记忆是语言理解的前提与结果,没有语言理解就没有语言记忆,没有语言记忆也就没有语言理解。故婴儿没有语言记忆,听不懂的话语和看不懂的文字不会形成内容记忆,但可能形成某种对象记忆[2]

“理解与记忆”悖论——蛋与鸡的悖论。

“语言学与公理1”悖论[3]

 

01-2 自然语言符号体系和语言概念空间符号体系

——为什么训诂学大师们看不起《马氏文通》

自然语言符号体系的地位和价值被索绪尔先生的崇奉者过分抬高了,因为自然语言符号体系不过是语言概念空间符号体系的殊相表现,而且它只关系到大脑(交际引擎)的接口,根本无关于大脑(交际引擎)的CPU与MEM。

语言概念空间符号体系才是大脑CPU(智力)与MEM(记忆)实际运用的符号体系,承载这个符号体系的硬件(大脑皮层的神经系统)是人类百万年进化的产物,其发育成长过程的基本定型大约要5年左右的时间,运行这个符号体系的软件则需要更长的“编程”与“试运行”时间,至少20年左右吧。这一点 奥古斯丁早在1,600年前就讲得比较清楚了[4],理论语言学和心理学的研究似乎都没有充分参照奥古斯丁的重要思考。

训诂学大师们与奥古斯丁“心有灵犀”,他们之所以看不起《马氏文通》,要害就在这里。

让我们把上面的话语从交际的角度重复一下:语言交际绝不是一个单纯运用自然语言符号体系的过程,而是自然语言符号体系和语言概念空间符号体系两者交替运用的过程。这里存在两个基本过程:表达过程和理解过程,表达过程最终必须通过输出接口使用自然语言符号体系,但理解过程仅使用语言概念空间符号体系,自然符号体系的作用仅限于通过输入接口激活理解基因

语言概念空间符号体系是内在物,是自我的终极载体之一,是交际引擎的中枢;语言符号体系不过是外在物,不是自我的终极载体之一,而只是自我表现的手段之一,仅有关于交际引擎的对外接口。

如果我们只关心语言交际,那么我们也许可以只关注自然语言符号体系,而不必去关心那个看不见、摸不着的语言概念空间符号体系;但是,如果我们要去探索人类思维的奥秘或大脑运作过程的奥秘,那就必须同时关注两个符号体系、而不能只关注一个符号体系了。不仅如此 还必须把探索的重点转移到语言概念空间符号体系,因为 这个符号体系才是思维的存在之本

这个答案是不是一个老掉了牙的答案呢?难道科学如此昌明发达的西方专家不知道这个答案么?难道西方的相关学界没有思考过语言概念空间符号体系么?人工智能学界没有思考过么?计算语言学界没有思考过么?认知心理学界没有思考过么?语言哲学界没有思考么?《皇帝新脑》一书的作者没有思考过么?乔姆斯基先生以其毕生精力研究过的普适语法UG难道不属于语言概念空间符号体系么?

这些问题的答案不过是一层窗户纸,但笔者历来采取“走为上”的态度,不去碰它。

 

01-3语言概念空间符号体系与语言理解基因

语言概念空间符号体系是大脑里的五类概念符号体系之一,另外四类概念符号体系的名称分别是:图象、艺术、科学和情感。

每一个符号体系都拥有自己的理解基因。

理解基因主要是智力基因,而不是生理基因。

大脑之谜实际上主要是五类理解基因之谜,而不仅仅是生理基因之谜。

当然 理解基因与生理基因是相互交织的,但交织度应该存在巨大差异:

可以设想 语言、图象、科学和艺术理解基因的交织度比较弱,

情感理解基因的交织度比较强。

五类理解基因的迷雾度存在着巨大差异:

当前的基本情况是:图象与艺术理解基因的迷雾度最浓,科学次之。

情感之谜的迷雾度似明似暗,在那里 理解基因的作用应小于生理基因。

说这些话是为了烘托出下面的命题:

语言理解基因的迷雾已基本洞开。

 

01-4语言理解基因的自然语言表述

我经常想 什么样的东西可以用来描述语言理解基因的结构与功能呢?神经元显然是不合适的,因为单个神经元不过是理解基因的一个元件,连组件的资格都不具备,而理解基因必然是许多神经元的复杂组合或连接。有一天 我忽然想到印度的种姓制度,觉得它是一个非常合适的描述样板。请看下表:

         印度的种姓                          HNC理解基因的范畴

婆罗门    精神生活(文化、教育)           三类精神生活

刹帝利    政治(军事、法律)               主导性第二类劳动

吠舍      经济、医疗                       基础性第二类劳动

首驮罗    体力劳动                         第一类劳动

贱民      低级体力劳动                     本能活动

 

此表说明 古老的印度种姓制度最接近于HNC对理解基因的第一级(范畴)划分,这“最”是相对于希腊-罗马文明、古老中华文明而言的。前者有“贵族-平民-奴隶”的划分,后者有“士农工商”的划分,这两种划分也考虑到了社会的结构性和功能性,但并没有将两者融为一体,种姓制度则体现了一种彻底的融合,用哲学的术语来说就是:本体论与认识论的彻底融合。现代印度正在逐步消解这种古老印度式融合的非正义性或非人道性,不过 如果单就融合本身来说 应该说它体现了一种高级的综合与演绎智力,而现代文明则过于强调分析与归纳智力了,20世纪后期的解构主义更是把这种强调推向了极端。我对解构主义的浪潮深感恐惧,因为 第一 各学科都由于这一浪潮的推动而走上了置综合与演绎于不顾的可怕地步。第二,任何信念、理念或主义一旦被解构,就会演变出极度畸形的价值观。当前的中国一方面正处于欣欣向荣的工业时代春天,另一方面不是也处于古老中华文明和马列主义都被解构以后的严冬季节么?!

理解基因就是智力基因的别称,是智力结构与功能的完美结合,是智力本体论与认识论的完美结合,这种完美结合是全能上帝的创造或“专利”,开普勒的惊叹是有道理的。但人们往往只注意到开普勒惊叹的话语,而忽略了它的实质:原来如此复杂的物理现象竟然可以用一个如此简明的符号体系来加以描述,这一点既是绝大部分科学实际走过的历程,也是所有科学的基本共识。HNC的使命就是对语言概念空间给出一个符号体系的描述,而且顺便把这个符号体系数字化(为了迎娶数据数字化这位“昭君”)。但是 该符号体系只追求康德所说的透彻性和齐备性,也就是说 只追求智力结构与功能的某种融合,而不追求完美性,因为如上所述 完美性是上帝的“专利”。某种者 局限于语言概念空间也。

语言理解基因的基础符号体系就是[HNC-1],其符号表示式比较复杂,这里就不写了。但是 其总体设计思路十分简明,那就是下面的语言表述:

         理解基因::=范畴表示+结构与功能的各级综合表示

         范畴与“各级”者 层次也;

         结构与功能者 网络也,局部网络也,非全局网络也。

这里有一项关键性的技巧,那就是对结构与功能分别赋予不同的约定数字符号。

    语言理解基因的全貌也是可以用语言来描述的,那就是下面的六句话。

[HNC-1]是语言概念空间符号体系的数字化表示;

    部分[HNC-1]是语言理解基因的基础结构;

[HNC-2]和[HNC-3]是语言理解基因的上层建筑;

概念关联式是语言理解基因的主体信息渠道;

语言理解基因主要靠词语直接激活,这种激活是大脑输入接口的基本转换功能之一;

语言记忆就是从[HNC-3]到[HNC-4]的转换。

 

01-5语言记忆贯穿于语言理解过程的始终

这个问题需要从记忆公理2谈起。

记忆公理2说“语言记忆是语言理解的前提与结果,没有语言理解就没有语言记忆,没有语言记忆也没有语言理解”。这个论断里 记忆和理解都出现了3处,3处理解具有相同的内涵与外延,但3处记忆则具有不同的外延。为叙述便利 下文将把这3处记忆依次简称记忆1、记忆2和记忆3。

先说记忆2。记忆2对应于通常所说的记忆,即“从[HNC-3]到[HNC-4]的转换”所形成的记忆,上文曾名之语言记忆,也就是HNC命名的语境生成或语境,是语言记忆的可自感(可回忆)部分,可名之显记忆;记忆3则由稳定记忆与动态记忆两者构成,稳定记忆包括语言理解基因的基础结构、上层建筑、主体信息渠道和输入接口转换器,是记忆的不可自感(不可回忆)部分,可名之隐记忆。动态记忆大体相当于心理学的工作记忆,它又分为两部分,一是语境生成过程的过渡信息,最终不纳入显记忆,二是从已有显记忆里临时调用的相关记忆片段。

记忆1是记忆2与记忆3的总和,可名之广义记忆,包含显记忆、隐记忆和动态记忆这三种记忆类型。

HNC给出了显记忆和隐记忆的符号表示式,但尚未给出动态记忆的符号表示式,这属于记忆工程第三战役——智力培育——的任务。

    记忆力是指显记忆的能力,它强关联于一个人的知识面,但弱关联于一个人的智力。智力主要决定于隐记忆和动态记忆的能力,从这个意义说,智商是一个有待改进的概念,因为它既未作显记忆、动态记忆、隐记忆这3种记忆类型的区分,也未作智能与智慧的区分。而这样的区分对智力的研究或所谓脑力的开发至关紧要。

    隐记忆能力是大脑智力的核心指标,是大脑软件“编程”与“试运行”进度的基本考核指标,对这项指标的研究需要新的思路,HNC团队有责任推进该思路的酝酿与完善。这些话语实际上已经是“事后诸葛亮”了,可当今的诸葛们 在功利主义和解构主义全球浪潮的冲击下 基本处于昏迷不醒的可怜状态。所以 这里不得不说一声:学友们 我爱你们,你们要警惕啊!

 

 

语言记忆模式与记忆样式分目录

02-1 语言记忆两模式:范畴-领域模式和对象-内容模式

02-2 语言记忆两样式:共相样式和殊相样式

02-3 大脑硬件的输入接口连接于语言记忆的对象内容模式

02-4 关于思维的语言依存性

 

 

02-1 语言记忆两模式:范畴-领域模式和对象-内容模式

HNC理论“三‘无限-有限’说”的第三说是:语境无限而语境单元有限。这里的语境其实就是指显记忆,语境单元其实就是指隐记忆,也就是语言理解基因。请记住下面的两个基本命题吧:

命题1:语境单元有限 =: 理解基因有限

命题2:理解基因有限 ≡ 语言概念空间的范畴-领域有限

(“=:”者 等同也,非完全等同也;“≡”者 强关联也,互为因果者也。)

上列命题的推理是:显记忆(语境)是理解基因运作的结果。理解基因是依据范畴与领域排序的,那么 显记忆跟着“如法炮制”就是最自然不过的“理所当然”了。“如法炮制”的学名就是语言记忆的范畴-领域模式。

但是 范畴-领域记忆模式显然不利于动态记忆的形成,动态记忆需针对特定的对象或内容,这些特定信息必然散布在不同的范畴-领域,从大的方面说 人都会有三类精神生活和两类劳动的个人范畴经历,从小的方面说 专业人士不但会有不同专业的个人领域经历,也会有各种精神生活的个人领域经历。因此 必须配置另外一种语言记忆模式以便于针对特定对象或内容的搜寻。这另一种语言记忆模式就是对象-内容模式。[HNC-3]和[HNC-4]分别以范畴-领域(DOM)和对象-内容(BC)为纲 道理就在这里。

范畴-领域模式和对象-内容模式对应于两种索引方式,这有点类似于汉语词典的笔画索引和拼音索引,《现代汉语词典》就配置了这两种索引,但两者有虚实之别。实者 拼音索引也;虚者 笔画索引也。

大脑语言记忆两种模式的存在乃联想逻辑的简明推论,可当作记忆公理3来对待。但HNC还引入了一项基本假设:范畴-领域记忆模式是实模式,拥有相当于《现汉》的拼音索引,对象-内容记忆模式是虚模式,拥有相当于《现汉》的笔画索引。后者与语言输入接口直接连通。

 

02-2 语言记忆两样式:共相样式和殊相样式

语言记忆两模式只面向显记忆;语言记忆两样式则是面向广义记忆。

广义记忆存在两种样式:共相样式和殊相样式。共相和殊相是一对哲学概念,意思同共性与个性“差不多”,这么说吧 它就是共性与个性的哲学表述。就语言记忆来说 如果使用共性样式和个性样式的术语也未尝不可,但我还是觉得共相样式和殊相样式的表述要传神得多。为什么?这需要语言记忆公理2说起。

语言记忆公理2的论断之一是“没有语言记忆就没有语言理解”,此论断里的“记忆”不是人们常说的记忆,而是前已指出的隐记忆和动态记忆。这个记忆应该处于大脑皮层的“中央”区,而不应该处于大脑皮层的边缘区——海马。爱因斯坦说过“上帝是奇妙的”,这里也许可以补充说“上帝的第一奇妙就是把隐记忆和动态记忆安置在大脑的中央区,把显记忆安置在大脑的边缘区”。这样的安置或设计才符合智力效率原则,最近有人说 “大脑如同城市”[5],此话多少有点形而上的味道,因为智力效率原则的空间特性应该与城市效率原则相类似。

除了与智力效率原则对应的区域差异之外 隐记忆、显记忆和动态记忆还存在个人之间的巨大差异,这一差异的要点可以概括以下三点:

差异1:隐记忆大同而小异,显记忆大异而小同。

差异2:隐记忆可结构齐备,亦可结构残缺

差异3:动态记忆可功能强大,亦可功能低下。

隐记忆的大同性与显记忆的大异性是不言而喻的,但如何理解隐记忆结构的齐备性与残缺性、动态记忆功能的强大性与低下性呢?也许可以先这么说 隐记忆结构的齐备性与动态记忆功能的强大性是上帝赋予记忆的基本特性,不因人而异。但是 隐记忆结构的残缺性与动态记忆功能的低下性则因人而异,因此 也许可以还这么说:“为什么基督文明要强调人类的原罪性?其哲学思考就全在这个‘因人而异’里面了”。不因人而异的记忆和因人而异的记忆当然需要加以区分,这就是HNC引入共相记忆和殊相记忆的根据了。简言之 共相记忆是上帝赋予的记忆,对应于隐记忆的基本结构和动态记忆的基本功能。殊相记忆不是上帝赋予的记忆,是原罪之源,其内容首先是指显记忆,其次是指隐记忆结构的残缺性和动态记忆功能的低下性。

所谓社会的进步 本质上就是提高人类共相记忆的水平,丰富人类殊相记忆的内容,如此而已。这似乎很容易成为地球村六个世界[6]的共识,其实不然。现代化的当前实际效果是在降低共相记忆的水平,贫乏殊相记忆的内容。这是我的幻觉么?但愿如此。

 

02-3 大脑硬件的输入接口连接于语言记忆的对象内容模式

这里陈述了一个命题,这个命题将命名为大脑接口公理1。该命题必然存在一个对偶(孪生)性命题,可命名大脑接口公理2,其内容涉及“大脑硬件的输出接口连接于什么类型的记忆”。

本小节回避大脑接口公理2。

大脑接口公理1对交互引擎[7]的重要启示是:语境分析可以而且必须依靠词语的直接激活。为什么人们可以在嘈杂的语音环境里进行交际呢?为什么有人可以轻松地以一目十行的方式进行阅读呢?答案只能从公理1去寻求。在奇妙的上帝看来 并行计算或自适应噪音过滤不过是一种技术,大脑智力处理用不着这些玩意儿。

 

02-4 关于思维的语言依存性

    西方比较语言学曾经把汉语列为自然语言的最低级形态,这个荒谬绝伦的结论早已没有市场了。但其潜在影响依然存在,这就是汉语思维落后说,最近还有人在宣扬这种谬说。此说的依据是思维具有语言依存性,但记忆公理否定了这种依存性,因为思维并不使用自然语言符号体系,而使用语言概念空间符号体系。当然 思维会受到文明因素的制约,但文明因素与语言因素之间是不能划等号的。

 

 

语言记忆工程三大战役分目录

03-1 三大战役概说

03-2 机器翻译战役=:“赤壁之战”

03-3一目千行战役=:“垓下之战”。

03-4智力培育战役=:“图灵之战”。

 

03-1 三大战役概说

    语言记忆工程的三大战役的名称是机器翻译战役、一目千行战役和智力培育战役。

语言记忆工程的三大战役也就是交互引擎的三大战役。

三大战役胜利之日 就是“迎娶昭君”之时。

对三大战役需要一些基础性智力,主要是:

智力1:科学、技术、产品、工程(系统)之间的因果链关系;

智力2:玩新与创新之间的量变与质变关系;

智力3:内功与外功之间的根叶关系;

机器翻译战役是智力1之战,以“I/O”为主;

一目千行战役是智力2之战,以“MEM”为主;

智力培育战役是智力3之战,以“CPU”为主。

三类智力之间紧密相关,“之战”的命名是为了突出各自的重点。

三类智力也就是三类关系,可统称因果关系。

但因果关系只是智力的非分别说,而智力还需要分别说。

智力分别说的框架如下:

    =>   

作用  =>    效应

 

            过程                     关系

=>作用  =>           =>   效应   =>             =>…

            转移                     状态

 


过度迷恋智力非分别说就容易受到功利主义和解构主义的严重误导,特别是下列4项:

    问果不问因果链;

    问流不问源;

    问外功不问内功;

    问速效不问远虑;

其严重后果必是:“蔽目之叶”流感,而“知秋之叶”濒危。难道这幅景象是我的幻觉么?我不知道。

 

03-2 机器翻译战役 =:“赤壁之战”

HNC团队为机器翻译进行了多年的准备,现在的状态确乎是“只欠东风”。

机器翻译本身也存在三大战役,它非常类似于解放战争的三大战役——辽沈战役、平津战役和淮海战役。

非常值得回味的是 毛主席最初并未看出淮海战役的战机,但毛主席的英明就在于他还是及时抓住了这一中国整个历史上最为壮观的战机。

对与大正公司和HNC团队来说 没有比机器翻译更好的“赤壁”了。问题是《三国演义》的误导确实仍然在起作用,科技界就是有人在大力宣扬和推销诸葛亮的魔术。于是 有人反而误以为“孙权决策+周郎挂帅”不是真正的东风了。

 

03-3一目千行战役 =:“垓下之战”

一目千行这个短语是“一目十行”的抄袭,一目十行用于才子的描述,一目千行则用于“语言超人”的描述。一目千行的搜索早就做到了,现在的问题是要做到一目千行的“搜索+理解+记忆”。其中的“理解+记忆”是语言超人的“CPU+MEM”,而“搜索”只是“I/O”。搜索所形成的惊人战果只是数据库(Data Base),而不是记忆“MEM”。

一目千行战役是记忆工程的关键战线。

赢得了这场战役就必然成为信息产业的第四代霸主,迎娶昭君的婚礼就可以举行了。所以 把它比拟于“垓下之战”是贴切的。

“垓下之战”让韩信们出尽了风头,但该战给后人留下的最大历史教益是:“刘邦的第一流形而上+萧何的第一流形而下”才是决定性因素。那么 目前的HNC团队具备这两个“第一流”的潜在素质么?请参考一下我这个1/8张良的意见吧:刘邦属于天授(这是韩信得以免死于第一次“死罪”的关键词)的范畴,本文仅略说“萧何的第一流形而下”问题,它属于 “智力1因果链条”的因端。而因端的研究当前都陷于严重营养不良的困境,这是全球科技战线大环境的整体性危机。我们这个局部环境能够获得“特区”待遇么?这就需要“刘邦的第一流形而上”了,如果能够获得,那一切就可以迎刃而解,否则就不好说了。

一目千行不能只针对汉语,因此 需要机器翻译战役的配合;一目千行要“千里之行,始于足下”,要从一目一行甚至一目一词做起,因此 需要智力培育战役的协同。

 

03-4智力培育战役 =:“图灵之战”。

前文说过 大脑硬件的基本定型至少要5年左右的时间,大脑软件的“编程”与“试运行”至少需要20年左右的时间。这个论断可视为记忆公理的推论,也是对交际引擎发育过程的基本描述。这一描述对交互引擎或语言超人研制的指导意义很值得思考。

所谓智力培育战役 略说之 不过就是为交互引擎安装并调试“大脑”软件,安装的主体内容就是隐记忆的上列各项构件;调试的主体内容就是考察显记忆的量与质动态记忆的功效

这一安装与调试过程需要运用4棒接力智慧[8],而不是当前统计方法的后1.2棒智慧和所谓综合策略的后1.8棒智慧。

因此 智力培育战役的内容与图灵检验有天壤之别。那么为什么要用“图灵之战”这个名称呢?这不仅是由于图灵先生当之无愧,更是为了学习他那独特的“深入虎穴”精神。

    发明计算机的最初需求不过是为了加快计算速度,但图灵先生的视野却在那个时期就超越了计算本身,而深入到计算的虎穴:思维的本质就是计算么?为此 他提出了著名的图灵检验,触及到理解和记忆的形而上思考。后来 哲学家的批判(如塞尔的《心灵的再发现》)和物理学家的补充(如彭罗斯的《皇帝新脑》)都依然只是理论上的探索,HNC团队应该把这一探索推进到智力3的高水平长征。高水平者 苦练内功也,走根深叶茂之路也。那统计 仅仅是外功,派他去搞点侦察活动是可以的,但心里必须明白 他的侦察能力也很差,不可能搞到关键性的情报,那东西 还得靠高级特工和一叶知秋的判断力。

 

04结束语

我们已经拥有一个描述文字数据与文字记忆转换的理论体系,这一转换的内因障碍在文字领域已不复存在,我们完全有条件先行一步。既不必等待大脑之谜的探索取得实质性进展,更不要“唯美首是瞻”!我深信 大正公司及其强大后盾一定会下定决心迈出数据-记忆转换的第一步——文字数据到文字记忆的转换,这一步将意味着什么 大家肯定比我想得更透彻。

高级信息形态转换的探索一直处于被冷落的可悲状态,将简称冷落悲剧。

在科技领域发生这种现象似乎是不可思议的。然而 这恰恰是“美国引领”所必然造成的后果。因为美国是爱迪生、福特和比尔•盖茨的天堂,但并不是康德和爱因斯坦的天堂,而高级信息形态转换的探索却需要康德和爱因斯坦式的情怀与素质;美国没有那种曾风行于前(指半个世纪前)欧洲的那种艺术与科学沙龙,而高级信息形态转换的探索需要这样的学术环境和土壤。

所以 冷落悲剧也可以称为美国引领悲剧,是当代所有专业活动领域的普遍现象,不只是信息科技领域,脑科学的情况也许最为严重。那里只存在游击战或麻雀战,没有战役的思考,更没有战线的思考。所以 我们切不可一切“唯美首是瞻”。

冷落悲剧何时会出现转机呢?《对话》[9]曾素描了一幅悲观的前景,但是这次研讨会的主办单位已经做出了一些漂亮的成绩,可以乐观一些了。所以 我这个老人很高兴暂时脱离一下闭关状态,参加这次研讨会,就文字数据-文字记忆的转换问题讲了上面的三点思考。

    谢谢,阿门!

 

 


注释:

[1]主要指酶分泌、神经胶质细胞、传导液等的发现。

[2] HNC理论对“对象与内容”、“具体概念和抽象概念”都给出了特定的定义,这些特定定义对语言的分析、理解与生成可形成立竿见影的效果。在语句分析阶段(层面) “对象与内容”密切联系于句类,在语境分析阶段(层面) 对象仅联系于具体概念,内容仅联系于抽象概念。这时 对象记忆是关于特定人与物的记忆,而内容记忆是关于特定事件的记忆。

[3]语言学关于“语言与思维的经典陈述”里存在原则性的不妥论断,例如 下面的论述——“从功用来说 语言又是人类赖以思维的工具,人进行思维,思考问题,都必须依附于某种具体的语言,所以语言一向被认为是思维的物质外壳。”——就是一例,可视为“语言学与记忆公理1”悖论的典型代表。(注:黑体是原有的,这里的“工具”、“依附”、“一向”和“物质外壳”等都属于十分不妥的用语。请同下面[4]奥古斯丁的论述比较一下吧,那是多么可怕的倒退啊!)

[4]奥古斯丁在《忏悔录》里有一系列关于思维与语言的精彩论述,这里仅摘录其中的一段: “我开始学语了,并不是大人们依照一定程序教我言语,和稍后读书一样;凭仗你,我的天主赋给我的理智,用呻吟,用各种声音,用肢体的种种动作,想表达出我内心的思想,…但不可能表达我要的一切…为此,听到别人指称一件东西,或看到别人随着某一声音做某一种动作,我便记下来;我记住了这东西叫什么,要指那件东西时,便发出那种声音。…这是各民族的自然语言:用面部表情、用目光和其他肢体动作、用声音表达内心的情感,或为要求,或为保留,或为拒绝,或为逃避。这样一再听到那些语言,按各种句子中的先后次序,我逐渐通解它们的意义,便勉强鼓动唇舌,借以表达我的意愿。”(注:黑体是笔者加的)

[5]大脑如同城市的说法见《参考消息》第7版。

[6]六个世界分别是:经典文明世界、市场社会主义世界、经典文明模拟世界(以日本、印度和俄罗斯为代表)、伊斯兰世界、部落世界(非伊斯兰的非洲)和征服遗裔世界(美国和加拿大以外的美洲)。

[7]交互引擎是“交际引擎(人类的大脑)计算机模拟”的简称,它以文字文本的理解和记忆为其中心目标。语言生成需要加一个输出接口,语音文本需要换一个输入接口。

[8]4棒接力智慧的4棒分别是理论、法则、规则与算法。

[9]《对话》是笔者向前一届同名研讨会提交的论文,全名是《一位形而上老者和一位形而下智者的对话》。