HNC理论全书

 

第三卷 第四编 论记忆

 

编首语

读者应该记得,HNC的理论探索之路,是从“三无限与三有限”的3项假设起步的,后来才加上“显记忆无限而隐记忆有限”的第4项假设。这4项假设最终演变成关于语言脑的4项公理,这意味着本编应该是关于第四公理的论述。

但本编标题是:论记忆。理由如次:(1)本《全书》此前所论,可以说都是关于隐记忆的,本编将是显记忆的专题论述,不涉及隐记忆;(2)显记忆就是人所熟知的记忆,不过,仅涉及大脑的语言脑,不涉及大脑的非语言脑部分。加上“显”,仅仅是为了第四公理表述的需要或便利,本编的文字就没有必要带着这个累赘了。但是,不带着这个累赘,该术语很容易造成不堪忍受的误会,HNC多次经历过此类惨痛的教训,句类是一个,语义块更是。这两个命名曾使HNC后悔不迭,由于这个缘故,过去一直把语言脑的显记忆叫做语境生成。不过,语境生成这个术语将依然保留,《全书》里以往出现的“语境生成”都不必改成“显记忆”,更不用说《定理》和《理论》了。

记忆是一个古老的话题,心理学正式诞生以后,出现了许多关于记忆的专著和论文。这些,本编拟彻底避而不论,回避度将远大于此前对语言学的回避,如果说本《全书》对语言学的回避度约为“0.6”,那对心理学记忆的回避度就接近于“1”了。这是模仿上一编关于“帝国”的量化描述方式,此话已经非常直白,再添点什么就是多余的话了。

本卷的后四编,不属于本《全书》最初的预定计划,是后来添加的,因为它们已经超出了纯粹的理论范畴。这添加的四编,与科幻作品有某种类似性,其撰写方式将尽量向科普作品靠拢。但笔者对这类作品,既生疏又畏惧,只能“摸着石头过河”。本编位置介乎前三编与后四编之间,有趣的是,其内容的特质也介乎两者之间,这使笔者感到“左右为难”,最后想到的是下列12个字:仿效科普,谨言慎写,少出差错。

本编分5章,各章编号、汉语命名和相关HNC符号列表如下:

编号        汉语命名                相关HNC符号

第一章      记忆与领域                  (ABS,DOM)

第二章      记忆与作用效应链            (ABS,XY)

第三章      记忆与对象内容              (ABS,BC)

第四章      动态记忆与记忆接口浅说      (DM,(I/O)M)

第五章      广义记忆杂谈                MEM

 

这里未安排记忆总论,将在第一章里略说。五章的设置体现了HNC关于记忆的全部重要思考,这些思考密切联系于HNC探索历程中的基本心得。在“相关HNC符号”栏里,给了记忆两种符号:ABS和MEM,这将在第一章里说明,其他的在相关章节里说明。

 

 

第三卷 第四编 第一章

 

记忆与领域

 

引言

这里首先要说明的是,本编所论的记忆,仅指语言脑的记忆,而不涉及大脑其他构成(这包括生理脑、图象脑、情感脑、艺术脑和科技脑)的记忆。这就是说,本编所说的记忆只是心理学记忆的一部分,是狭义记忆,HNC符号为ABS,取自英语的abstract。心理学记忆是广义记忆,HNC符号为MEM,取自英语的memory。由于本编主要跟狭义记忆打交道,故狭义记忆将简称记忆。而广义记忆的广义二字,则一般情况不省略,不过,引用心理学术语时可以例外。

英语词语abstract的汉译是摘要,将狭义记忆符号化为ABS,体现了HNC的下述思考:语言脑记忆的实现通常就是摘其要,而且HNC已经搞清楚了如何摘其要,本编的前两章,就是试图说明如何摘其要。这些话很关键,但仅适用于语言脑,未必适用于生理脑、图象脑、情感脑、艺术脑和科技脑。因为,面对后列各脑所处理的对象与内容,我们还不知道如何摘其要。也许可以说,这从一个侧面为语言脑的存在性,提供了一个间接证据。

用计算机科学的术语来说,记忆就是语言脑的RAM,也是语言脑的数据库DB。用人们熟悉的术语来说,记忆就是语言脑的词典或百科全书。

那么,语言脑这个特殊的“RAM、数据库、词典或百科全书”如何编辑、存取和更新?这是关乎记忆的天字第一号课题,本章将为该课题提供第一组答案,具体内容划分成下列3节:

1 同一领域的记忆分置于不同位置是不可思议的

2 不同领域记忆区块(记忆单元)之间的信息传递

       (记忆单元之间的信息传递)

3 不同领域记忆区块(记忆单元)之间的缓冲区

 

各节都不分小节,这将成为本《全书》此后的惯例。

 

 

第三卷 第四编 第一章 1节

 

同一领域的记忆分置于不同位置是不可思议的

 

本节标题有点怪异,其用意在于再次突出一下HNC关于记忆的下述假设:记忆应该按领域划分区块。下文将把这个假设叫做第一记忆假设,在HNC视野里,该假设具有天经地义性,是关于记忆的公理。

形成此假设的前提是:HNC对领域DOM这个概念或术语拥有自己的一套独特描述方式,且自我感觉良好。此良好感觉的基本依据何在?一句话,就在此前的全部论述里,就在HNC四假设//公理的前三个里。不过,这里不妨写一点笔者本人的一段心路历程。初期的想法是:领域拥有的语境概念树数量多达236株,占据了语言概念空间的大半壁江山,HNC已经从理论上把这片江山描述得很清楚了,记忆不过就是这片江山在言语脑里的一种景象而已。但后期逐步形成了另外一种想法:那236株语境概念树诚然类似于如来佛的手掌,记忆很像千变万化的孙悟空,孙悟空固然逃不出如来佛的手掌心。然而,对于如来佛的手掌,我们毕竟还只有那么一个物理层面的理论认识。要真正揭开语言脑之谜,还有待于微超和语超的研发。这个想法,在一定程度上是从《全书》向着《定理》回归,也是一种愿景。在《定理》中,曾以一篇文字(篇名是:在反思中前进,在碰撞中成长)结束语的形式,对该愿景给予过充分表述。本《全书》第三卷添加的后五编,不过是对该愿景的若干技术性交代而已。

这增加的五编必将带有浓重的科幻色彩,文字上只好勉其为难,力求普及。前此的全部论述,可以说就是为了表明:该色彩可以脱离虚幻,变成现实。本编前两章所选用的标题,就是为了凸现这个要点。

“脱离虚幻,变成现实”的基本依据是关于语言脑的4项公理,下面先对前3项公理给出一个通俗性的复述,依次名之要点m(m=1-3),统称3要点。

要点1:自然语言空间的每一个词语,无论是哪个语系的,也无论是以往的、当前的或未来的,一定可以在概念基元空间(语言概念空间的第一层级)找到自己的对应位置——语境基元SGP或非语境基元~SGP,该位置的数量可以是一个,但多数情况是多个。反过来来看,第一层级语言概念空间的每一个概念基元,不一定能在自然语言空间找到自己的对应词语。如果能够找到的话,其词语数量永远是多个,即使是对于一种特定的语言,也基本如此。

要点2:自然语言空间的每一个小句,无论是哪个语系的,也无论是以往的、当前的或未来的,一定可以在句类空间(语言概念空间的第二层级)找到自己对应的位置——基本句类SC或混合句类MSC。基本句类的数量是:(8=4+4;68=30+18+20);混合句类的数量,理论上是:68*67=4,556[*01]。反过来看,第二层级语言概念空间的每一个句类,特别是其中的混合句类,不一定能在自然语言空间找到自己的对应小句。某些自然语言,可能基本句类都不完整,某些发展中的语言,甚至可能连最基础的8种类型都不完整。

要点3:自然语言的句群,无论是哪个语系的,也无论是以往的、当前的或未来的,一定可以在语境单元空间(语言概念空间的第三层级)找到自己对应的位置——主体语境单元SGU或基础语境单元~SGU。语言脑的语境单元总量不存在精确的数字,因为该总量的计算方式本身就需要一定的灵巧性。不过,对104量级的估算则是可以信赖的,这是由于HNC仅服务于语言脑所管辖的世界知识,这就可以把大脑其他构成所管辖的海量知识,特别是其中专家知识,采取“睁一只眼,闭一只眼”的灵巧处理策略。单一句群对应的语境单元数量可能不只一个,这意味着语境模糊现象可能暂时呈现,但“三二一原则”一定可以把语境模糊度降低到最小。反过来看,第三层级语言概念空间的每一个语境单元,不一定能在自然语言空间找到自己的对应句群,这主要是由于许多语境单元是为后工业时代而预先设计的。在人类历史长河中,工业时代毕竟只是短暂的一瞬,而后工业时代才刚刚降临。后工业时代将会产生现在人们难以想象的句群,正如同农业时代的人们,难以想象工业时代出现的那些句群一样。这就是说,与概念基元和句类相比,语境单元或语言理解基因[*02]的时代性演变将更为显著。这个话题,部分读者可能觉得比前两个话题更难理解,这没有关系,记住要点m(m=1-3)的下述省略说法就是了。

3要点也可以概括成这样一句话:语言脑的概念空间里,存在着许多空概念基元、空句类、空语境单元或空语言理解基因。这句话,可以诠释成语言脑所特有的“四大皆空”,是佛学四大皆空总原则的一个特例。没有这四“空”,语言脑的适应性是不可思议的,思维的演变与发展也是不可思议的。

下面回到本节的主题——记忆。

记忆是什么?记忆如何实现?本节回答第一个问题,下一节回答第二个问题。

“记忆是什么?”这个问题,在语言脑的奥秘中,可以说它是最简单的,但也可以说它是最复杂的。

说它最简单是因为,没有一个正常人不能回忆起当天、最近以及以往的“事”。这个带引号的“事”,就是记忆,回忆就是记忆的呈现。

说它最复杂是因为,一些关于记忆的简单追问似乎还没有透彻的答案。例如,能不能说婴儿根本就没有记忆?如果说婴儿有记忆,它却不可回忆,为什么?可回忆的起始年龄,不同人的差异甚大,为什么?记忆应该随着时间而减弱,但老年人的记忆却会出现“新‘事’如烟,老‘事’如昨”的奇特景象,为什么?失忆现象是记忆ABS或广义记忆MEM本身发生了故障,还是记忆接口I/O发生了故障,或两者兼而有之?这样的追问,可以列出一个很长的清单。

但是,这样的追问不在多少,而在于是否具有尖刀性[*03]。尖刀性追问是:记忆如何编辑?而该追问的前追问应该是:语言脑在记忆之前是否需要一个学习编辑基本功的时期?婴儿是否就是该基本功的学习期?该学习期的时间长短是否因人而异?这3项前追问的答案都应该是:Yes。这样,也就大体回答了上列追问清单的前三项。

对“记忆如何编辑”的深入追问,HNC一如既往,从假定做起。其基本假定是:记忆应该按领域来编辑,同一领域的记忆应该安置在语言脑的同一个记忆区块里。该假定不过是把汉语的一句成语换了一个说法,该成语是:物以类聚,人以群分。不要小看这句成语,它揭示了类聚哲理的精髓。HNC从自然语言理解处理的视野,对该说法或该哲理进行过系统的论证,该论证的核心论点是:语言脑对自然语言的理解处理最终归结为语境分析SGA,而语境分析的关键举措是领域认定,因为领域一旦被认定,语言理解处理过程所遇到的一切劲敌和流寇都将束手就擒。这个要点,将在《微超论》里作进一步论述,本节请先采取“姑妄信之”的态度。这些话,书生气十足,其实可以用一字来替换它,那就是:懂,汉语词语“懂事”里那个懂。该词语通常仅用于夸奖孩子,似乎不宜用于其他年龄段的人,那是误解。懂的前提是领域的认定,懂的效应是形成记忆,懂的结局是把记忆存放于某处。

这某处如何确定?如果你想过要追问这个问题,那答案还不明显么?两个字:回家。那家,就是已被认定的领域。有家不归,四处流浪,那才不可思议。本节之所以采用比较怪异的标题,到此总算有个交代了。该标题可变换成如下的简明陈述:记忆按领域聚居,同一领域的记忆聚居在一起,这是记忆的基本原则。

本节到此可以结束了,但似乎缺了点什么。记忆是什么?上文的说法是:这个带引号的“事”,就是记忆,回忆就是记忆的呈现。这就是正式答案么?请读者自行思考。不过,这里将提供一批最早的素材,以供参考。相关素材拷贝如下:

对当前的计算机来说 言外信息是不存在的,不具备言内信息与言外信息相互耦合的基本条件,因而也就不可能形成交际语境。这就似乎出现了“皮之不存,毛将焉附?”的严峻态势。但是 言内信息与言外信息并不是毛与皮的关系,而是类似于鸡与蛋的关系,是相互依存的关系

传统语境研究仅面向交际语境,它主要关注鸡生蛋的过程,即语境的运用。而交互语境的研究则应首先关注蛋生鸡的过程,即语境的生成。交际语境里的“鸡”只有人,交互语境里的“鸡”加入了计算机;交际语境里的“蛋”首先是口语,交互语境里的“蛋”则应首先定位于书面语,而且最好是先避开诗歌、童话和特殊运用方式的方言。交互语境是交际语境的简化,是交互引擎简化交际引擎的模拟中最重要的一个环节,主要目的是为了便于实现交互语境的生成。HNC语境说主要是基于这一思考而启动自己的探索

如果我们说:听和读在大脑里留下的东西就是语境,语境就是言语的效应。那上述“皮之不存,毛将焉附?”的矛盾就不复存在,而交互语境的生成就有希望了。

如果我们说:语境当然具有个人、民族、地域、专业的特性(个性),就如同言语具有类似个性一样。但是 语境必然和必须具有共同的基本框架特征,承认这一点 我们就有可能着手这一框架的设计了。(以上引文见《定理》p37)

语言学提出过话语的四项基本原则[21]:真实原则quality(不说假话)、适量原则quantity(不多不少)、扣题原则relevance(不说无关的话)和明晰原则manner(条理清晰)。实际语言并不严格遵守这四项基本原则,但相对说来 对扣题原则的偏离最小。扣题就自然形成句群,句群就是围绕着一个特定概念展开的话语,“题”就是指一个特定的概念。“题”的转移就意味着句群的变动。这个“题”在语言空间并不显现在音和形上,而是隐现在义上。人是通过概念联想脉络抓住这个隐现之“题”的,但计算机就困难了。HNC概念基元符号体系的作用就是把这个语言空间隐现的义转变成语言概念空间显现的义,这样 计算机就有可能抓住这个“题”了。(《定理》p39[*04]

“题”之有限性问题似乎走进了死胡同,摆脱这一困境的关键在于抽取“题”之要素,HNC语境说将“题”之要素抽象为领域DOM、情景SIT和背景BAC三项。第一要素领域DOM来于言语活动主要面向人类活动的思考;第二要素情景SIT来于万事万物都必须遵循作用效应链规则的思考;第三要素背景BAC来源于上述言内信息必须与言外信息相互耦合的思考。我们把这三要素构成的东西命名为语境单元SGU,如 (HNC3) 所示。HNC认为:抓住了这三项要素就等于抓住了语境构件的牛鼻子,其他都是枝节了。(此段引文见《定理》p40

这里还应该指出,语境单元三要素并不构成一个三维度独立且等价的空间,而是一个以领域DOM为主轴的三维空间,其情景SIT和事件背景BACE都是领域的函数。领域DOM这一主轴类似于我们熟悉的实际空间的铅直坐标。(《定理》p41

    引文里说:听和读在大脑里留下的东西就是语境,语境就是言语的效应。这话没有错,而且,其中的语境可以换成记忆。这个论断,也请读者自行思考,笔者不作任何解释了。

 

注释

[*01] 在以往的HNC文献里,长期使用过“基本句类57,混合句类3,192”的正式陈述。不过,笔者曾多次呼吁过,不要对这两个数字过于较真,关键在于那个“8=4+4”。对于这里的68和4,556这两个数字,应发出同样的呼吁。

[*02] 语境单元和语言理解基因是两个概念,形式与内容都存在很大差异。但实质上,两者是一枚钱币的两面,语境单元的总量与语言理解基因大体相同。这里用“或”字把两者联系起来,如果感到突兀,那就请回过去翻阅一遍上一编——《论语境单元》。

[*03] 尖刀和抹布曾是笔者极度喜爱使用的两个词语,不过,在知道分别说与非分别说,想到“点说、线说、面说、体说、点线说和面体说”等词语之后,该喜爱有所减弱。在《理论》的《论辅块》里(p191),对该喜爱的渊源给出过一个值得回味的说明,有兴趣的读者可以参阅。该页的文字有笔误,其中“我父亲当时46岁”里的“46”应为“44”。

[*04] 本段引文里的义,是意义的义,而不是语义学的义。当时单用一个义字,不用语义二字,就是为了与语义学的义划清界限。那时,这个认识虽然才刚刚起步,但已经比较坚定了。

 

 

                   第三卷 第四编 第一章 2节

 

不同领域记忆区块之间的信息传递

(记忆单元之间的信息传递)

 

本节标题包含5个关键词:不同、领域、记忆、区块和信息传递,也可以说包含3个关键词:不同、领域记忆区块和信息传递[*a]。这里的词是词//词组的简称。下面按3个关键词来说明,先说领域记忆区块,次说不同,最后说信息传递。

上节说:同一领域的记忆应该安置在语言脑的同一个记忆区块里,领域记忆区块这个关键词即缘起于此。领域记忆区块将名之记忆单元,故本节标题也另名为“记忆单元之间的信息传递”。

那么,单个记忆单元是个什么样子(形态)?可以比作一个住户么?如果可以的话,那它与左邻右舍是什么关系?对这些问题,现在只能先说几句不太离谱的话,每个记忆单元可以比作一个住户,其左邻右舍多半是同一姓氏或类似职业的人员,来往比较密切,像农业时代乡间的村庄或城市里的胡同,不像现代城市公寓大厦里的住户,基本上老死不相往来。

记忆单元的构成或形态描述是第二章的事,所以,上述第一和第三个问题的答案都要放到那以后来说明,本节只讨论记忆单元作为语言脑住户的有关话题。

不同这个关键词在《现汉》和《现范》都没有收录,这是一个不应有的小失误。略知英语的读者都知道,英语有对应词语different。本节以“不同”修饰“记忆单元”,这似乎是很平常的事,其实并不寻常,需要一个比较深入的思考,这主要体现在下述四个方面。第一、本节的不同是基本概念的不同,不是基本逻辑概念的相异[*01];第二、本节的不同具有范畴性、层次性和局网性[*02]的三级区分;第三、本节的不同包含分别说和非分别说的灵巧运用[*03];第四、本节的不同还包含记忆单元本身的过程性变化。

关于不同记忆单元的上述4项说明,第一项实质上仅关乎记忆单元的定义,对记忆单元之间的信息传递没有什么影响,但后三项却都与信息传递有密切关联。从信息传递的视野看,记忆单元的住户比喻似乎不那么恰当。

现代住户有自己住宅的信箱或门牌号(包括邮编号码)、电话号码(座机与手机)、电子邮件地址,这些东西是住户的信息传递工具。但是,住户的这些工具能够与记忆单元的领域代码挂钩么?答案比较有趣。除了门牌号之外,相临住户的手机号码和电子邮件地址谈不上多少关联性,仅座机号码的关联性可能多一点。记忆单元的领域代码则截然不同,相邻记忆单元之间的关联性在其领域代码里得到了充分体现。这就是说,一个记忆单元的领域代码要比一个住户的全部信息传递工具“高明”得多,如果把记忆单元比作语言脑的住户,那么就可以说,每一位住户的基本信息都包含在其领域代码里,这包括该住户的身份证及其全部信息联系方式,不仅如此,其紧密邻居的相应信息也可以由该领域代码推知。这意味着语言脑里的住户可没有人类住户的那些隐私和自由,其境遇很类似于大秦帝国的老百姓。

这就是说,在信息传递的意义上,语言脑的记忆单元就相当于大秦帝国的住户。

但是,即使是大秦帝国的住户,也有走亲访友(虽然秦帝国对此类活动有严密限制)之类的交际,更不用说繁重的劳动了。这两样东西,语言脑的记忆单元拥有对应者么?

说来有趣,答案是:Yes。“劳动”的对应者是第四章要论述的动态记忆,那么,“走亲访友”的对应者是什么?可以设想,对应者应该是远方的亲友,问题在于:对远方亲友的探访需要信使CSE(全称是概念空间信使CSE,也简称使者或使节)的帮助么?

信使CSE属于隐记忆,与概念基元(包括语境基元和非语境基元)捆绑在一起。如果记忆单元的探访活动需要信使CSE的协助,那记忆单元就需要与隐记忆挂钩。这就是说,记忆与隐记忆不可能截然分离,从而会引发出一系列非同寻常的问题。例如:记忆单元如何保存探访活动的档案?那档案里是否需要记录有关信使的名单呢?请注意,这两个问题的性质有所不同,档案是如何保存的问题,不是保存与否的问题,因为探访活动必须以某种形式存档。信使名单则不是如何记录的问题,而是记录与否的问题,因为参与探访活动的信使不一定需要存档。从这两个问题的表述来看,似乎谈不上什么非同寻常,那么,非同寻常从何而来?答案是:来于记忆单元本身的复杂性,它不仅如上所述,不像现代城市公寓大厦里的住户,也大有别于村庄或胡同里的住户,而是与皇宫里的各级“主子”住户有得一比。那些“主子”的探访活动档案不是一个“内务府”可以包办得了的。实际上,记忆单元的情况可能比皇宫里的“主子”住户还要复杂[*04]。非同寻常者,此其一也,仅关乎对外交际也。也许可以这么说,如果把一片语境概念林类比于一个帝国,那么,一株语境概念树就可以类比于一个王国,语境延伸概念可以类比于该王国的各个部门和机构(政府的和非政府的),而记忆单元则可以类比于该王国的各类住户或居民。

下面来说明一下非同寻常的“此其二”,它涉及记忆单元的过程性变化,该变化关系到记忆单元的内部信息传递。住户有红白喜事,记忆单元亦然,但其频度可能要大得多,其内容的丰富度或许也远非世俗的红白喜事可比。

每个人都有自己的专业领域和非专业领域(业余爱好是其中的一部分)。专业领域必须与专家知识打交道,主要是科技恼或艺术脑的事[*05],但世界知识的作用对某些专业领域的作用可能依然极为重大,甚至不亚于专家知识。非专业领域的情况则完全另外一番景象,世界知识的作用经常远大于专家知识。而世界知识主要是语言脑的事,那就要同本节的记忆单元打交道了。该交道的核心课题就是本节的“此其二”,说它不寻常,那一点也不夸张。本节将这“此其二”的不寻常性,概括成6项追问,简记为追问m(m=1-6),目录如下。

——追问1:记忆单元的首次激活(将简称初次记忆[*06])是否需要记录一些特殊信息?

——追问2:记忆单元对多次激活的结果如何进行重组与改写?(将简称记忆单元的重组与改写)

——追问3:记忆单元的激活与调用如何区别处理?

——追问4:记忆单元与记忆群如何区别处理?

——追问5:记忆区块是否需要设置一个“特区”,以便实现记忆与隐记忆的互动?

——追问6:长期不被调用或激活的记忆单元如何处理?

 

对于上列6项追问,广义记忆理论能回答多少,笔者并不清楚,也不介意。因为,广义记忆理论是一种关于大脑的大统一理论,不区分大脑的6大功能构成,而大脑之不同功能构成的记忆机制能被统一描述么?笔者深表怀疑。以追问1为例,情感脑最有可能产生强烈的初次记忆,突出表现为:对第一次情感活动的有关细节可能终生都在记忆里珍贵保存。所谓“一见钟情”或“初恋”,并非全是小说家的虚构,每个现代人都会有自己的素材,这些素材是“初次记忆”说的生动例证。但语言脑的初次记忆应该比较少见[*07],其他脑也应该如此。这里把初次记忆列为追问m之首,似乎过度照顾了广义记忆的探索需求,从而偏离了本《全书》的撰写宗旨。其实情况并非如此,这样做,主要是由于考虑到:初次记忆与那些关于记忆的简单追问(见上一节)密切相关,而HNC理论对此无能为力,但记忆(语言脑的记忆)又不可能与它完全脱离干系。把无能为力的东西放在追问的首位,是一个探索者应有的态度。关于追问1就浅说这些吧。

现在来浅说追问2。广义记忆理论关于追问2有大量论述,按照已经交代过的原则,本节仅就语言脑说一些极度粗浅的话,共10点。(01)任何记忆单元的原始形态都是一块白板[*08]。(02)每一记忆单元在第一次被激活时,其语境可能差异甚大,所形成的记忆初态(即初次记忆的特定形态)也可能差异甚大,两者的差异建议用低、中、高3个档次来加以描述。(03)语境与记忆初态的档次并不直接对应,因人而异。少数人可以获得高档次的记忆初态,尽管其第一次遇到的语境档次并不高,多数人只能获得低档次甚至极低档次的记忆初态,尽管其第一次遇到的语境档次可能并不低。(04)“3档次”说也可以用于记忆单元的态势描述,三者对应于记忆单元态势的3次质变:从白版变成初态记忆、从初态记忆变成中态记忆、从中态记忆变成高态记忆。(05)所谓“记忆单元的重组”,不仅涉及到记忆单元态势的升级过程,更重要的是,还涉及到记忆与隐记忆的相互作用。(06)“3档次”的每一档次可以再细分,记忆单元态势的这种细分仅对应于量变而无关乎质变,它相当于HNC概念延伸结构理论的自延伸环节。(07)所谓记忆单元态势的升级过程可以是质变,也可以只是量变。质变是不可逆的,而量变是可逆的。(08)记忆单元态势的低态、中态、高态占比因人而异,也因语境领域而异。(09)所谓记忆与隐记忆的相互作用主要是指记忆单元的质变与语言理解基因的相互作用,非初态记忆的形成可能反过来带动语言理解基因LUG*的生长,特别是语言脑信使CSE*的生长,高态记忆的反作用力度应远大于中态记忆。(10)一个人的智力不仅取决于其隐记忆的丰富度,也取决于其高态记忆的占比[*09]。这10点将简记为粗说m(m=01-10)。

上面引入了低态记忆、中态记忆和高态记忆的术语,这些术语能否得到认同并不重要,重要的是,没有此类相应的术语,记忆的重组与改写问题就比较难以描述。记忆重组是对记忆单元质变的对应描述,记忆改写是对记忆单元量变的对应描述。紧跟着的问题是,此质变与量变的内容可以给出具体的描述么?或简单地说,两者可以量化么?这是一个致命的问题,但现在没有条件作答,只能放到下一章去,理由是明摆着的,就不必说什么了。

接着来浅说追问3。首先要说明一下激活和调用这两个术语的异同。两者都会牵涉到特定的记忆单元,这属于同;激活是直接牵涉,调用是间接牵涉,这属于异。那么,怎么区分直接牵涉与间接牵涉呢?我们已经知道:语境单元与记忆单元是一一对应的,如果正在处理的语境单元恰好就是对应的记忆单元,那就叫做直接牵涉,或该单元被激活。如果不是这个情况,而是由于动态记忆的参与,牵涉到其他的记忆单元,那就叫做间接牵涉,也可以说有关记忆单元被调用了。

被激活的记忆单元一定要进入追问2所描述的重组或改写处理,被调用的记忆单元则不是一定要进入,而只是可能进入。此浅说里也留下了一个尾巴,就是动态记忆,那是第四章的事了。

下面该轮到追问m(m=4-6)上场了,先说这么一句话吧,它们都不会出现尾巴现象。

追问4涉及记忆单元与记忆群的区分与处理。我们已经说明过,记忆单元是一个与语境单元对应的东西,语境单元又是一个与语言理解基因对应的东西,因此,记忆单元也是一个与语言理解基因对应的东西。把握这些对应性是回答追问4的要点。

记忆单元有分别说与非分别说之分,记忆群有大中小之分,这些是应该首先澄清的两组概念。这些区分,在语言理解基因里的论述里已相当详尽,依样画葫芦就行。不过,这里还是科普一下为宜。分别说记忆单元,是指一个与常量语境延伸概念对应的记忆单元;非分别说记忆单元,是指一个与变量(包括常量的非)语境延伸概念对应的记忆单元,但其中可以包含带小括号的变量符号(语言理解基因的氨基酸符号)。大记忆群指依托于语境概念林或语境概念树的记忆群,中记忆群指分别依托于一组OD或ED描述的记忆群;小记忆群指依托于一个特定OD或ED描述的记忆群。

现在,为什么本节标题采取一主一辅的特殊表示方式就一清二楚了,原来是为了把记忆群也包含进来。记忆单元之间的信息传递方式与记忆群之间有那么一点微妙的差异,那就是常量信使与变量信使的差异。记忆单元只利用常量信使,记忆群则主要利用变量信使。变量信使也可以叫做使团,常量信使是使团里的个别成员。信使就是所谓的概念关联式,有内使与外使之别。HNC已经花费了很大力气探索语言脑的各类信使CSE*,收获巨大,追问4涉及的问题不过就是信使的调用,有什么可追问的呢?此问有点尖刀性,回答只好“绵里藏针”:请回去看一眼粗说09吧。该粗说里实质上隐藏着一只HNC暂时也抓不住的狐狸尾巴,即显、隐记忆如何相互作用。所以上面的不留尾巴说是打了马虎眼的,因为,那只抓不住的狐狸尾巴,同样也将在追问5和6里显现。

追问5涉及记忆特区这个概念或术语,也可以叫做显记忆的过渡形态或过渡记忆。在标题里,特意加了一句话:以便实现记忆与隐记忆的互动。在隐记忆的全部论述中,可能会给读者造成一个错觉,以为HNC主张:隐记忆与记忆的关系是鸡生蛋的关系。所以,这里要郑重申明一下:隐记忆与记忆的关系是鸡与蛋的关系,而不是鸡生蛋的关系。这种关系就决定了,记忆必然存在特区,记忆特区里的记忆,或过渡记忆,其基本特征是:既不姓“显”,也不姓“隐”,其语境基元或语境单元的归属暂时未定

可以想象,记忆特区的体量[*10]将随着年龄的增长而减小,通常,到不惑之年将减至最小[*11]。每一片特定记忆特区将经历一个从不显不隐状态到显状态的转换过程,该过程也就是相应隐记忆从原初形态走向成熟形态的转换过程,语言脑的整个成长历程与这些转换过程相伴随。该历程大体可以区分成下列6期:婴儿期、幼儿期、朦胧期、青春期、学士期和后学士期,其中“朦胧期、青春期、学士期”的年龄段大体对应于现代的“小学、中学、大学”,但不同个体的差异甚大,某些人可以在10岁前就在许多方面达到学士期,有些人则可能一辈子在某些方面也达不到。这两类人与孔夫子所说的“上智”与“下愚”有一定联系,但决不等同。孔夫子的“上智”与“下愚”以人的整体表现为参照,HNC则以语言脑功能的多侧面呈现为参照。依据上述关于隐记忆与记忆相互作用的阐释,一个人的智力,可以在某些方面表现为“上智”,又可以在另一些方面表现为“下愚”。在孔夫子看来,一个文盲不可能是“上智”,但HNC不这么看。

上述阐释涉及到语言脑记忆发育过程的要点,也涉及到智力成长过程的要点。该要点可以归结一个字——学。此学是指“禀赋作用效应链7220β”(见[122-2.0-1]分节)之“仁、学、义”里的学,专属于语言脑,主要学习世界知识,而不是专家知识,将简记为“学”。“学”不同于词典意义的学习,也不是所谓“刺激-反应”理论里的学习。“学”是语言脑的一种天赋,一棵善于“学”的语言脑,即使是文盲,也会成为“上智”。一棵不善于“学”的语言脑,即使专家知识再高明,也可能仍然属于“下愚”。现代化的学习过于看重科技脑或艺术脑的学习,一言以蔽之,现代化的学习实质上仅围绕着专家知识打转,也可以说仅围绕着科技知识打转。这是一个科学独尊的时代,不仅人文-社会学都要披上科学的外衣,甚至整个神学与哲学的探索也都巴不得披上这件外衣,以方便进入大雅之堂。现代化学习形式上不能说不关注语言脑,甚至可以说非常关注语言脑,但实质上仅关注语言脑的语言生成,并不关注语言脑的语言理解或“学”。这样,就在科学独尊的大时代背景下,造成了现代社会的世界知识匮乏症。这个话题,前文曾给出过多次论述,这里是最后一次的呼应了。

上一节曾叙说过一些关于记忆的简单追问,提及“可回忆的起始年龄”的差异问题。这里就便呼应一下,那差异,即缘起于不同个体朦胧期的差异。

记忆特区或过渡记忆的概念与术语,是否会碰上比语块和句类更不幸的遭遇呢?很有这个可能。但一个探索者要不在乎遭遇,并且不怕献丑。这是本节撰写过程的基本态度。

最后来浅说追问6,它包含两个性质完全不同是问题:记忆的调用与激活,简记为追问6-1和6-2。为了回答追问6-1,不妨先引入下列两组概念:雏形记忆与成型记忆、记忆的淡忘与消失。然后引入下述假设:雏形记忆如果长期不被调用,便会从淡忘走向消失;成型记忆不同,它只会淡忘,不会消失。这应该是记忆的基本特质,从而也就对追问6-1给出了一个初步回答。上述两组概念里的第一组似乎需要说明一下,雏形记忆与成型记忆不同于追问5里所阐释的过渡记忆,两者都是语言脑记忆住户的正式户口,而后者是临时户口。拿鸡与蛋的比方来说,雏形与成型记忆对应于鸡生蛋(基于隐记忆而产生记忆)的过程,过渡记忆则对应于蛋生鸡(基于记忆而生成并完善隐记忆)的过程。

上述对追问6-1的回答都是假设,是否成立需要验证。在这里,先验理性的作用或许用得上“到此为止”这个话语了。下面对追问6-2的回答亦将面临同样的状况。

追问6-2的假设性回答是:雏形记忆要经过反复激活,才能转变成成型记忆。“上智”的特征之一是:完成该转变所需要的激活次数很少,“下愚”反之,所需要的激活次数很多。但无论是雏形记忆或成型记忆,长期不被激活的效应只会淡忘,不会消失。

本节把记忆比做语言脑的住户,最后,对此比喻作两点说明。(1)该比喻意味着隐记忆不是住户,那么,隐记忆如何安顿呢?语言脑的政府与组织机构应该是比较合适的类比了。(2)由住户的比喻而引入了正式户口和临时户口的说法,第二世界以外的读者可能对这两个词语感到难以理解,这好办,向你身边的大陆中国人询问一声就OK了。

 

注释

[*a] 按照词的组分(笔者习惯于用“词的组分”替代中文信息处理学界习用的“分词”)来说,一个词组也可以采取“领域、记忆区块和信息传递”这样的对称划分方式。为了突出记忆与领域的紧密联系,这里故意采取了文中给出的不对称划分方式。

[*01] 基本概念“不同j762”对应于(j5,j4),基本逻辑概念“相异jl002”对应于(j4,j5)。两者在意义方面存在细微而重大的区别,这种区别用自然语言来表述就比较低效,而HNC符号却可以游刃有余。

[*02] 局网性这个术语也许是第一次使用,局网泛指概念树的延伸结构表示式,本节则特指语境概念树。

[*03] 这第三点,部分读者可能觉得难以理解,这没有关系,第四章会有呼应性说明。

[*04] 看过《甄嬛传》之类电视剧的读者,或许对此段描述并不感到陌生。但实际上,记忆单元的情况和面貌,我们还没有给出任何描述,那是第二章的事。这算是一个悬念吧。

[*05] 此话要谨慎对待,在“文法理工农医艺军”八大专业领域里,它或许十分适用于“理工农医艺”这五者,但对于“文法军”三者,可能就不那么十分了。

[*06] 这里的初次记忆实际上是初次广义记忆的简称。

[*07] 语言脑的初次记忆往往缘起于一些震撼性话语。笔者在中学时,曾有过多次这样的“奇遇”,胡适先生的“要东摸摸,西看看”话语(见“关系心理行为7301\03”子节里的“关系行为第一形态7301\03e4n综述”[123-0.1.0.3.1])是一次,“人民日报是党报,你不能这样铺在地上坐”话语是另一次。当时笔者是一个极度顽皮的落后学生,于是,一位进步同学就及时发出了那样的“警告”。半个世纪之后,曾谈起这件往事,当年的说者虽已毫无印象,但当年的听者却依然如在昨日。这两次“奇遇”,在笔者语言脑的初次记忆中,印象最为深刻,可给予冠军和亚军的头衔,如果还要弄出一个季军的话,那就是“尖刀与抹布”的“奇遇”(见上一节的注释[*03])了。

[*08] 白板说似乎是一句废话,其实不然。例如,主张“右脑是祖先脑,左脑是自身脑”的脑科学流派就不会认同白板说。

[*09] 前文曾有“智力主要决定于隐记忆”的说法,这里对该说进行了修正。

[*10] 这里的体量是指记忆特区的潜在特质,而不是指它的实际状态。实际体量的变化曲线应该是先增后减。

[*11] 这里借用了孔夫子的“四十而不惑”说法,不过,对该说法不宜过于较真。康德先生曾有一个著名的沉寂十年,但其时间并不在“不惑”(沉寂即为了解惑)之前,而主要是在半百之后。

 

 

第三卷 第四编 第一章 3节

 

不同领域记忆区块之间的缓冲区

 

对本章而言,本节或许是多余的,因为它也可以放到第五章里。现在的安顿方式是想再次突出一下记忆单元与语境基元的对应性,也就是记忆单元与语言理解基因的对应性。

本卷一开始,介绍过HNC理论的4项基本假设,其实,在这4项之上,HNC理论还有一项更基本的假设,不过,该假设产生于4假设之后,更准确地说,乃产生于4假设变成4公理之后。论地位,该假设高于4假设,从演绎的视野看,它应该先于4假设,但实际上不是“先于”,而是“后于”。这就是说,它实际上是从4假设归纳出来的东西,这就引出了一个疑问:该东西的出现是否正常?本卷的前三编,都提过形而上思维功力的话题[*01],这“后于”现象,实质上是不正常的,因为它是形而上思维功力不足的典型呈现。

这个地位更高的假设一直没有明说,现在是时候了,其汉语表述如下:

人类的世界知识主要由语言脑来承担,专家知识主要由科技脑和艺术脑来承担;生存知识主要由生理脑和形象脑来承担,其他知识主要由情感脑来承担,或者说,情感脑是知识的不管部。

此陈述也包含4项假设,是关于4类知识的假设。每项假设的陈述都带有“主要”二字,那是对4类知识之间复杂交织性的一种取巧性(不是灵巧性)描述方式。这里要告诉读者一个隐情,HNC理论虽然抱有知识应该划分为上述4类的明确想法,但又觉得这毕竟超出了HNC探索目标,不宜明说,因此一直有意回避对4类知识的正式命名。HNC的探索目标仅仅是语言脑的奥秘,因此HNC必然要对语言脑所管辖的知识给予特殊关注,并给予它一个正式命名:世界知识[*02]。

关于4类知识假设的陈述带有典型的“颠三倒四”特征,但事出有因,因为HNC只关注、也只需要该陈述的第一句:人类的世界知识主要由语言脑来承担HNC探索历程的全部“憔悴”都投放在世界知识的描述方面,而该描述里的最大“憔悴”又投放在领域的划分方面,这就自然引出了本节的标题。

标题里的不同领域主要是指语境范畴(含次范畴)的不同,可能包括某些语境概念林甚至语境概念树的不同,至于语境延伸概念的不同,则一律不在其列,这是本节标题的特殊约定。此约定体现了HNC的一项一直未敢明言的思考(假设),那就是:不同语境范畴的记忆区块应该拥有自己的特定区间,两类劳动与三级精神生活的区隔或许如同地球村的东西两半球,而三级精神生活的区隔或许类似于地球村的欧亚非三大洲,不同语境概念林和不同语境概念树的区隔或许类似于欧亚大陆上的不同世界。

本节标题里的“缓冲区”,在HNC看来,既如同地球村的太平洋和大西洋,也如同地中海、波罗的海、日本海与东海、墨西哥湾与加勒比海;既如同亚洲的喜马拉雅山和非洲的撒哈拉大沙漠,也如同西欧的阿尔卑斯山和比利牛斯山。语言脑记忆区块的所谓缓冲区,不过就是这么一回事。

这就是说,本节标题实际上也代表了一项假设。凭借大脑信号当前的检测技术,已经完全有条件对此项假设进行检验。那么,HNC为什么不提出相应的基础研究计划呢?这有三点考虑,第一点涉及此项检验的价值,第二点涉及信息处理学界的主流态势,第三点涉及HNC理论如何赢得业界的起码信任。下面仅略说前两点,第三点放到《论机器翻译》里说明。

语言脑奥秘的核心在隐记忆,而不在记忆。因此,即使此项假设得到了实验证实,对于语言脑奥秘的揭示,并不具有实质性意义。记忆与隐记忆的领域对应性是一种合乎逻辑的想象,即合乎基本逻辑里的“应有之有jl11e21e21”。但记忆与隐记忆的形态对应性则是不可思议的,而且,在不同领域的隐记忆之间,不仅存在着不同隐记忆基本载体[*03]的配置问题,更存在着各类信使大军的部署与指挥问题。

信息处理学界的大数据[*04]思维,语言信息处理学界的语料库思维,是经验理性思维在科技界异军突起的奇葩,其一统天下的态势方兴未艾。一切先验理性思维的形而上设想,在这朵奇葩面前,就如同“侏儒”面对“巨人”,挺起胸膛也没有用。HNC虽然没有任何理由把自己看作“侏儒”而自惭形秽,但实际上始终未能摆脱被巨人戏弄的悲剧,其典型表现就是不敢逆流而上,也在随波逐流。故“不提出”者,胆怯而不敢提出也。

 

小结

本章试图对“记忆是什么?”这个貌似平凡的问题给出HNC方式的回答,答案是:记忆是语言脑的住户,正式名称叫记忆单元。这里的住户与居民同义,但未选用后者,为什么?考虑到还有隐记忆,而它是比记忆更重要的居民。本节并没有直接描述住户本身的情况,而只是描述了各种住户区。这里的住户区不能理解为住宅区,住宅区仅涉及生活,而住户区还要涉及劳动。换句话说,这里的住户区兼顾了劳动与生活两方面的功能需求,可以是农村,也可以是城市,可以是民众区,也可以是华尔街,更可以是政府所在。

这是本编的第一个小结,就写这些,不像个小结,但却是本编的样板,也是今后各编的样板。

 

 

注释

[*01] 每次提及该话题的表述方式有所不同,三次使用的表述如下:

编次    表述方式

第一编  如果没有形而上思维的足够功力,你是很难看清彼山基本景象的,

第二编  惜形而上学思维功力未达“阑珊”境界,招致了不少遗憾

第三编  不能说没有一点“蓦然”的喜悦,但主要是形而上思维功力不足的懊恼

[*02] 这个说法并不意味着专家知识、生存知识和其他知识不是正式命名,但也不意味着它们就是正式命名。关键在于世界知识与专家知识的交织性,这在以往的论述里,给予了充分阐释。至于生存知识和其他知识这两项,模糊一点是明智的做法。语言脑以外的命名也应作如是观,例如艺术脑曾另名技艺脑,两者含义差异很大,但也不妨混用。

[*03] 隐记忆基本载体也许是第一次使用,定义为“概念基元CP、句类SC和语境单元SGU的综合体”。

[*04] 大数据是最近才流行起来的术语,但大数据思维不是,大数据思维者,统计物理之思维方式也,这是它的狭义理解。不过,物理学界的前辈大师们对此早有广义思考,大数据的提出者是否了解这些历史,笔者不敢妄评。

 

 

第三卷 第四编 第二章

 

记忆与作用效应链(ABS,XY)

 

引言

本章是对记忆单元本身的描述。用上一章的比喻说法,本章是对语言脑住户的描述,上一章是对住户区的描述。所以,这两章的顺序可以交换,现在的顺序是从大到小,交换后的顺序是从小到大。前者是汉语的表达习惯,后者是英语的表达习惯。汉语的表达习惯实质上就是形而上思维的习惯,HNC接受这个习惯,历来如此。读者对此应该已经比较习惯了。

本章的标题——记忆与作用效应链(ABS,XY)——意味着,所谓语言脑住户的描述ABS,无非就是作用效应链 XY的呈现或展现。

作用效应链是HNC理论体系的命根子,当然也是语言脑住户的命根子,如果说语境单元所描述的是语言脑住户的肉体,那么,作用效应链所描述的就是语言脑住户的灵魂。当然,这里的肉体与灵魂都是比喻,是哲学意义、而不是神学意义下的比喻,但接受了“灵魂不灭”的伟大思考。这一思考里的不灭性是隐记忆与记忆的基本特性,而记忆之所以具有这一特性,是因为它是一项转换的产物。那转换叫情景转换,就是把语境单元SGU的情景描述SIT转换成记忆ABS的作用效应链描述XY。

这就是说,标题里的符号XY乃是作用效应链描述的总代表,它包含作用效应链的6个环节。但6环节有作用与效应、过程与转移、关系与状态的3侧面描述方式,3侧面的符号分别是:XY、PT和RS。那么,总代表的符号不是与作用效应侧面的符号发生混淆了么?这是本章首先需要解答的问题。HNC把这个问题归结为描述与叙述的区分,但这项区分是非常纠结的,其纠结度类似于所谓的客观与主观或唯物与唯心,远大于所谓的形而上与形而下,更远大于所谓的辩证法与形而上。本大句里的“类似于”属于哲学话题,“远大于”和“更远大于”则属于准哲学话题,这里只是提一下而已。

本章与上一章一样,也分3节,标题如下:

1节:作用与效应侧面的记忆以殊相记忆为主——(XYD,XYN)

2节:过程与转移、关系与状态侧面的记忆以共相记忆为主——(PT,RS)

(记忆模板论)

3节:广义作用效应链之判断侧面在记忆中的角色

D句类和jD句类在记忆转换处理中的特殊角色)

 

两章都采取3节划分,这种巧合不是偶然的,但对此不进行讨论。

本章前两节的标题分别使用了殊相记忆和共相记忆的术语,这两个术语以前曾分别用于描述现在定义的显记忆和隐记忆。这就是说,HNC曾对这两个术语赋予了不同的定义,这里正式宣告,原定义作废,但使用原定义的原有文字将保持原貌而不予改动。

 

 

第三卷 第四编 第二章 1节

 

作用与效应侧面的记忆以殊相记忆为主——(XYD,XYN)

 

本节和下一节的标题分别采用了殊相记忆和共相记忆的术语,多数读者可能对它们比较生疏,这两个术语还具有不应有的HNC多义性,这不太符合本章撰写方式“仿效科普”的约定。现在对这两个术语的新定义进行说明,希望通过它们传递如下极为重要的世界知识:人们对同一事物[*01]的记忆可能差异很大,殊相记忆的术语缘起于此;也可能大体相同,共相记忆的术语缘起于此。前者主要属于该事物的作用与效应侧面,后者主要属于该事物的过程与转移侧面或关系与状态侧面,这两个“主要属于”是本章要传递的核心世界知识。传递不等于论证,它可以小于论证,但大于举例说明。下文就按照这个思路来撰写,至于其“成败利钝”,则“不拟逆料”[*a]。

一个语境单元的情景SIT描述需要经历一项关键性的转换,那就是把该句群实际使用的句类代码转换成该句群所对应的领域句类代码SCD。同理,一项记忆ABS的生成也需要一项关键性的转换,那就是把领域句类代码描述转换成作用效应链的3侧面描述,其中最重要、最复杂的转换是作用效应侧面的转换,因为该侧面的记忆具有鲜明的殊相性。但是,殊相不是全部,对作用效应侧面的共相记忆也不能置之不理。基于这一考虑,HNC引入了两个记忆符号:XYD和XYN,前者用于表示作用效应侧面的殊相记忆,后者用于表示作用效应侧面的共相记忆。两符号里的“D”和“N”分别取自英语词语Descriptive和Narrative的首字母,因此,殊相记忆将另名描述性记忆,共相记忆将另名叙述性记忆。

下面,应该给殊相记忆和共相记忆来一点信手拈来的举例说明。不过,此刻浮现在脑际的,竟然又是笔者亲身经历的三次震撼性“奇遇”[*02],它们所激发的记忆,都是典型的XYD,而不是XYN。这个举例仅照顾了笔者个人感受,实在对不住读者。于是,前文曾多次提及的工业文明清单[*03]就被信手拈来了。那个清单列举了8项内容,7项可纳入XYN,但第四项的地理大发现则不可,而必须纳入XYD,因为那个“发现”伴随着血腥的殖民暴行。故地理大发现完全不具备XYN的资格,它是典型的描述性记忆XYD。这种描述仅属于“撮尔”西欧或第一世界。原来就生活在那片土地上的民族(这里有意回避了土著民族这个术语),不太可能也不应该接受这种XYD型的表述。

上面介绍了语言概念空间关于记忆的两个极为重要的概念或术语:殊相记忆和共相记忆,澄清了此前的术语混乱。接着以两个“主要属于”的模糊方式表述了作用效应链3侧面的记忆特征差异,进而引入了两个极为重要的符号XYD和XYN,两者的汉语表述是作用效应侧面的描述性记忆和叙述性记忆。写到这里,对本节标题的文字不协调性[*04]大体给出了一个形式上的交代,但实质性交代则有待“下回分解”。

“下回分解”先说[*05]下列4项内容:(1)从SCD到(XYD,XYN)的转换处理;(2)(XYD,XYN)内容的明晰性;(3)(XYD,XYN)之间交织性的处理;(4)XYN是最华丽的语言面具。

4项内容下文将简记为内容m(m=1-4),内容1是4项内容的纲,将详说,其他都简说。内容2与内容3具有内在的不相容性,将采取比较轻松的说明方式。内容4可有可无,将随意发挥一下。

 

——内容1:从SCD到(XYD,XYN)的转换处理

内容1的论述方式比较特别,先以较大的篇幅进行铺垫,使正题的阐释只需要少量的话语,这当然只是一种期望,未必能够如愿。

本章引言提到:符号XY既是作用效应链的总代表,又是作用效应链之作用效应侧面的代表,为免除符号上的多义(混淆),HNC约定对后者引入了符号XYD和XYN。这本来是一个直截了当的简明回答,但引言却弃而不用,而另外写了一些似乎不着边际的话,其典型话语有:“HNC把这个问题归结为描述与叙述的区分”,“但这项区分是非常纠结的”。为什么要这么做?那里有两点“未言之隐”。

其一是:作用效用链3侧面的符号表示(XY,PT,RS)似乎不言自明,无懈可击,其实情况并非如此简单。该符号不仅是每一侧面非分别说的代表,也是每一侧面分别说的代表。那里对此“隐而未言”,这里是交代清楚的时候了。这里的分别说存在5种形态,其通用表示式(采用变量符号Om,m=1-2)如下:

(O1,O2,(O1+O2),(O1,O2),(O2,O1))

其二是:强调了作用效应侧面的描述与叙述区分,从而引入符号XYD和XYN。对作用效应链的另外两个侧面,实际上暗藏着“网开一面”的打算,但未明说。不过,上面的分别说通用表示式,把那隐藏的机关吐露出来了,如下表所示:

 

表:3侧面的描述与叙述表示

XYD =: (X;XO)

XYN = (Y;YO)

PTD = (T;TO)

PTN = (P;PO)

RSD = (R;RO)

RSN = (S;SO)

 

此表仅一个采用了符号“=:”(等同于),其他都采用了符号“=”(强交式关联于或优先于)。这既是一种约定,为了便于施行从领域句类代码SCD到记忆ABS的转换;也是一种叙述,它反映了作用效应链各侧面的一项基本特性。

以上,是内容1的底层铺垫。

内容1之转换处理的起点是领域句类代码SCD,弄清这个起点的状态,是搞好转换处理的前提,但这样的认识还不够透彻或不够“蓦然”。“蓦然”境界的说法是:此起点正是该转换的牛鼻子。

就种类和形态而言,领域句类代码SCD仍然是一群普通的牛,但又是一群奇特的牛。前者的牛鼻子符号是(GX,GY),对应于通常意义下的广义作用与广义效应;后者的牛鼻子符号是(GX*,GY*),对应于特定领域意义下的广义作用与广义效应。

如果把(GX,GY)比作一群“待价而沽”的牛或原生态牛,那么,(GX*,GY*)就是一群已经沽出的牛,可简称领域牛,因为买主被统称领域。领域牛与原生态牛相比,其种类和形态并未出现任何变化,但其习性却由于不同买主的调教而发生了巨变。领域牛的习性,就是其买主禀性的复制品。这项复制工程其实没有多少秘诀可言,然而却显得奇妙无比,于是,许多杰出学者都宁愿相信这是上帝的创造[*06]。这项并不奇妙的复制,正是语言理解基因的奥秘所在,也是语言脑强大理解功能的奥秘所在。

上面的“没有多少秘诀”和“并不奇妙”说法,通常不用于正式的科学表述,属于科普语言,它们缘起于上面的比喻。该说法所对应的正式科学表述,已经在《论语境单元》里花费了大量文字[*07]。不过,这里应该补充一点,上面关于(GX,GY)与(GX*,GY*)的比喻,完全可以与“一定类型特指l91\2”和“唯一特指l91\4”对应起来,这项对应性是天经地义的。因此,如果你对类型与唯一之间的天壤之别有一个清晰的感受,那就也会对SC与SCD之间的天壤之别有一个清晰的感受。而如果有了这种感受,那领域牛的奇妙习性就一点也不奇妙了,这就是一种佛学所说的般若或王国维先生所说“蓦然”。所以,这里不妨说一声,比喻有时确实可以产生画龙点睛的语用力量。

以上,是内容1的上层铺垫。

那么,内容1的中层铺垫是什么?这就要回到关于作用效应3侧面的描述与叙述表示式了。这组表示式将用于从领域句类代码SCD到记忆ABS的转换,这项转换,无非就是重写一组(GX*,GY*),其中最为常见、最重要的内容是本节的(XYD,XYN)。这项重写当然需要一套规则,但特别有趣、又特别关键的是,这套规则的生命或灵魂仅在于两点:扣题与简明,扣题就是领域认定DD,简明就是重写一组(GX*,GY*),而作用效应3侧面的描述与叙述表示式使该重写得到了简明性的可靠保证。这里不需要精细,更不存在所谓对例外规则的担忧,因为语言脑记忆ABS的固有特征就是如此。

许多读者可能可能上面的话语很不习惯,所以下面来一段内外两呼应。内呼应涉及本卷第二编里的基本句类代码新表和混合句类代码新规则,它们就是为这里所描述的记忆转换服务的。外呼应涉及语言学里著名的话语四原则:真实原则quality(不说假话)、适量原则quantity(不多不少)、扣题原则relevance(不说无关的话)和明晰原则manner(条理清晰)。这里要呼应的是,话语四原则的后两条对于记忆具有重要的直接启示意义,不过把明晰改成简明而已。前两条原则也具有一定的间接启示意义,但两者都需要质疑并予以改变。实际上,两项改变都非常大,真实原则被改变成描述性和叙述性记忆,适量原则被改变得面目全非,变成上一章所描述各种记忆形态。

铺垫到此结束。关于内容1的讨论,还需要说点什么呢?似乎重复一下在上层铺垫里的那句“‘蓦然’境界的说法”就可以了,不是吗!

 

——内容2:(XYD,XYN)内容的明晰性

如果说内容1还有那么一些新的说法,那么内容2就可以说完全是旧话重提了,因为它不过是HNC三公理的一次非分别说而已。所谓“(XYD,XYN)内容的明晰性”,不过就是HNC三公理的一种具体呈现。这个说法的形而上色彩比较浓重,有违科普方式的初衷,因此,可以考虑下面的说法:句类代码新表和混合句类代码新规则不仅为“从SCD到(XYD,XYN)的转换处理”提供了便捷的工具,也为“(XYD,XYN)内容的有限性”提供了理论保障。这样说,形式上更切题一些,但依然不够科普。科普式的说法是:句群里凡以X领头的句类一律纳入XYD,凡以Y领头的句类一律纳入XTN。这里以两个“凡以”修饰的两个“领头”意味着一种规范语言脑住户身份的方式,它不仅用于XY侧面的住户,也将用于PT和RS侧面的住户。句类代码新表和混合句类代码新规则,就是HNC为语言脑住户最新设计的身份证。身份证的设计有巧拙之分,最新设计未必最佳,请记住这一点。

 

——内容3:(XYD,XYN)之间交织性的处理

犯糊涂,瞎追崇,被忽悠,受骗上当,主要是语言脑对(XYD,XYN)之间的交织性处理不当的结果。把XYD当成XYN,或者反过来,把XYN当成XYD,是语言脑常见的两种失误。前者可能导致误认假恶丑为真善美的失误,后者可能导致误认真善美为假恶丑的失误。

上述现象是一切社会的主流,可纳入前文曾多次提及的柏拉图洞穴景象。柏拉图洞穴有农业时代与工业时代的两层级之分,后者与前者相比,其空间尺度的扩张,何只亿万之巨!于是,生活在工业时代的人们未免过于怡然自得而忘乎所以,竟然不知洞外有天。这种忘乎所以甚至可以埋没旷世奇才,在所有的时代性悲剧中,这大约是最容易被忽视的场景了。然而,此场景的伟大的思考者历来大有人在。有趣的是,农业时代反而为该项思考提供了更肥沃思维土壤,因为当时人们生活的洞穴太狭小了,那些旷世奇才更容易萌发出洞外有天的遐想,柏拉图就是这些旷世奇才的代表之一。但在整个工业时代,这样的旷世奇才只出现了一位,那就是前文多次提到的康德先生。

上面的两段文字乃是为了表明,(XYD,XYN)之间交织性的处理可以暂时置之不理,也就是说,可以按照内容2里所表述的两“凡以”原则办事。

本节“前言”交代过:内容2与内容3具有内在的不相容性,将采取比较轻松的说明方式。轻松文字的游戏就到此为止吧。

 

——内容4:XYN是最华丽的语言面具

内容3提到了语言脑常见的两种失误,这里必须强调的是第一种失误,也就是把XYD当成XYN的失误,其危害性要远远大于第二种失误,也就是把XYN当成XYD的失误。第二种失误误于过度警惕,而第一种失误则属于完全丧失警惕。过度警惕强交式关联于有备无患,而完全丧失警惕则强关联于愚不可及。两者不可同日而语,故这里仅对第一种失误以“最华丽的语言面具”为名随意发挥一下

该种语言面具的示例,前文给出过不少,这里不打算旧话重提,提供一段最新的范例,它来于奥巴马先生的2013年度国情咨文。

 

Now, if we want to make the best products   

(XY1J),[a25e25,积极经济治理]

,we also have to invest in the best ideas.  

(XY5J),[a25e25,积极经济治理]

Every dollar we invested to map the human genome returned $140 to our economy

--every dollar.                            

(XY02J),[a25e25,积极经济治理]

Today, our scientists are mapping the human brain to unlock the answers to Alzheimer’s.                               

(XY3J),[a63e22i,第二类实验研究]

They’re developing drugs to regenerate damaged organs   

(XD01J),[a629c37,产品开发]

;devising new material to make batteries 10 times more powerful. 

(XD01J),[a629c37,产品开发]

Now is not the time to gut these job-creating investments in science and innovation.

                                              (jDJ),[a25e25,积极经济治理]

Now is the time to reach a level of research and development not seen since the height of the Space Race.                         

(jDJ),[a25e25,积极经济治理]

We need to make those investments.           

(XYJ),[a25e25,积极经济治理]

 

现在,如果我们想制造出最好的产品,            (XY1J)

我们还要在最好的想法上进行投资。              (XY5J)

每一个我们用于测出人类基因图谱的美元都给我们经济带来了140美元的收入

——每一个美元。                            (XY02J)

今天,我们的科学家为解决老年痴呆症正在测出人类大脑的图谱。

(XY3J)

他们正在研制可以让我们器官再生的药品,        (XD01J)

发明可以让电池储电量比之前强10倍的新材料。   (XD01J)

现在不是损毁科技革新领域可创造就业方面的投资的时候。

(jDJ)

现在是在一个让研发达到一个自从太空竞赛以来从未见过之高度的时候。

(jDJ)

我们需要进行这些投资。                        (XYJ)

 

本段语料(句群)的标注方式比较特别,结果也比较有趣,下面略加说明。1)仅给出每个小句的句类代码,未标记语块和句蜕。(2)两位代表语言[*08]的句类代码全部相同,一一对应,作用型混合句类XOJ七个,是否判断句jDJ两个。此现象并非偶然,是一片知秋之叶,很不寻常。(3)对英语给出每个语句的领域信息,同时标出相应的汉语说明。汉语译文大体无误,领域信息雷同,故予省略。(4)在9项领域信息中,6项属于同一领域——a25e25(积极经济治理),2项属于a629c37(产品开发),1项属于a63e22i(第二类实验研究)。

上述4点涉及到语言理解处理的诸多难题,其中最难的一项似乎是领域认定DD,因为这里的每一个相关语句都没有预期领域的直系词语。但此项难题的解决,在这里可谓轻而易举,因为那不过是一项原则[*09]的简单运用。但这里需要讨论的不是这些难题,而是该句群的语言面具性。

此句群给人的印象是:奥巴马先生在叙述美国制造业的现状,奥巴马先生本人可能也是这样认为的。但实际上,该句群不是叙述,而是论述,其真实面貌不是XYD,而不是XYN,附带的句类标注标注指明这一点。此项标注不是一个普通的东西,而是一项很特别的东西,是HNC理论假定会发生在语言脑里的东西,是设想中的微超必须追求的东西。不过,这里并不深究这个话题,而只指出一个现象,即奥巴马先生本人或许十分相信并确定:对“在最好的想法上进行投资”,一定会“制造出最好的产品”;对“人类基因图谱”项目一美元的投入可以赢得140美元的回报;对“大脑图谱”的绘制,可以为“解决老年痴呆症”找到医疗妙方;“让我们器官再生的药品”和“让电池储电量比之前强10倍的新材料”即将问世。问题在于:(1)奥巴马经济治理清单里的“一定”、“可以”和“即将”具有多大的可靠性?(2)就算该清单的目标都能实现,它能再现20世纪第二次工业革命所创造的辉煌么?这两个问题下文将简称质疑1和质疑2。

质疑1里包含许多技术性或专家知识范畴的问题,个别问题存在明显的漏洞,这就不去说它了。但质疑2里却存在着许多重大的世界知识问题,下面,将围绕着它来科普一下。

关于20世纪第二次工业革命所创造的辉煌,这里只打算用两句名言来加以描述。第一句名言是:“苏维埃+电气化,就是共产主义”。第二句名言是:“现在的英国+共产党领导,就是共产主义”。两名言[*10]分别来于第二次工业革命的曙光和夕阳时期,考虑到共产主义在两位说者心目中的崇高地位,考虑到两名言的时间跨度,我们可以说“电气化”或“现在的英国”都可以作为第二次工业革命辉煌的标志。可是,在奥巴马经济治理清单里,那种标志性特征的东西何在呢?是“新想法”所造就的“1:140”投资回报么?是老年痴呆症防治和器官再生新药品的问世么?是种种强10倍新材料的诞生么?是研发新高度的不断呈现么?所有这些,既没有“电气化”的那种简明性,更没有“现在英国”的那种形象性。看来,奥巴马先生显然没有注意到,其4新(新想法、新药品、新材料、新高度)的双刃剑特征已开始出现重大变化,那就是很可能弊大于利。因为该4新的主要受益者将是1%的富豪,而不是总统先生所关注的广大中产阶层和10%的贫困者。而且,阁下也不应该忘记,贵国的2008金融危机不正是一系列杰出“新想法”和“新高度”的杰出产品么?阁下的国情咨文很有才气,但有悖于经济公理,科技迷信和需求外经的色彩都非常浓重,故不揣冒昧,质疑如上。

上面的文字里,对一个奇特现象没有直接面对,那就是描述4新的语句,约半数未使用语境单元“积极经济治理a25e25”所对应的领域句类代码XYkJ,敏感的读者会想到借助相关使者的信息支持,这当然是正确的思路,但不够完备。其中,两个使用了jDJ的语句尤其值得关注,这将在第3节专门进行讨论。

总之,奥巴马先生的2013年度国情咨文充斥着XYN语言面具的高明游戏,上面不过选取了其中的一段。毫无疑义,奥巴马先生是缝制语言面具的高手,当下的世界并不缺乏这样的高手,却十分缺乏剥开语言面具的高手。当然,缝制高手一转身,就可以成为剥开高手,但这一转身不属于现实行为7331,而属于个人行为7332。因此,在当下这个历史阶段,该转身必然是小概率事件。但小概率不是零概率,对奥巴马先生寄予这种转身期待也许算不上荒谬之极,因为他毕竟曾经对华尔街的过度贪婪,发出过非常严厉的警告。

本节是一次冒险的科普方式试写,到此可以戛然而止了。科普文字不讲究结束语之类的形式,诸如“对本节标题,需要灵巧式理解”之类的话语就不必说了,不是吗!

 

注释

[*a] 这里出现了两个带引号的四字文言表述,取自诸葛亮的《后出师表》,文字略有改动。

[*00] 关于底层铺垫…

[*01] 这里的事物就是HNC所说的对象与内容(第三章另有专题讨论),其最大载体可以是地球村的任何一个世界(首先指HNC定义的6个世界,也包括学界和媒体所描述的各种世界)或一种文明,其最小载体可以是任何个人或其任何一项行为。

[*02] 请参看上一章第2节的“注释[*07]”。

[*03] 工业文明清单的内容是:(文艺复兴,宗教改革,科技革命,地理大发现,工业革命,英国宪政革命,启蒙运动,法国大革命),不过,这里用“,”代替了原初的“+”,并在清单前后加了括号。本《全书》是在关于文明基因(神学、哲学和科学)的首次论述中顺便提到这个清单的,该论述的核心内容是康德的哲学哥白尼式革命和马克思答案,见“理想行为73219世界知识”小节([123-2.1.1])。

[*04] 本节标题破折号两边的内容似乎符合破折号的约定,其实不然。相对于破折号右边的表述而言,左边的表述很像“脱裤子放屁”,如果把标题改成“作用与效应侧面的殊相与共相记忆——(XYD,XYN)”就OK了。但本节标题偏偏采取了这种非OK方式,为什么?请读者先自行思考。

[*05] 这里特意使用了“先说”,因为 “下回分解”的部分内容要分流到第3节。

[*06] 《心灵、语言和社会》的作者塞尔先生是其中之一。这涉及心灵的话题,在“行为与理性7322”节([123-2.2])有所讨论。

[*07] 主要论述文字见“语言理解基因LUG”小节([330-2.2.1])。

[*08] 两位代表语言指英语和汉语,这个说法并非第一次使用。第三位代表语言指阿拉伯语,这将成为本《全书》的惯例。

[*09] 这里的“一项原则”是故意抛出的马虎眼,具体说明见下一章的第3节。

[*10] 第一句名言来于列宁先生,人所熟知;第二句名言来于王震将军,鲜为人知。后者显然是前者的复制,但内在含义有本质差异。第二句名言暗示了王震将军的一项独特领悟,那是关于“资本+技术”等同于现代“亚当+夏娃”的领悟。对第二句名言可以有多种形式的其他理解,不过,那都难免落入形而下的下乘。顺便说一声,该领悟里的现代仅对应工业时代,在后工业时代,上帝会还给人类送来新的“亚当+夏娃”,那应该本世纪后期的事了。

 

 

第三卷 第四编 第一章 2节

 

过程与转移、关系与状态侧面的记忆以共相记忆为主——(PT,RS)

                        (记忆模板论)

 

本节标题十分特别,撰写方式也比较特别。对此不加解释,寄希望于心领神会效应的出现,哪怕只有那么一点点。

作用效应链的3侧面划分类似于语言理解基因“天字1号”氨基酸t[*01]的一主两翼划分,作用效应侧面XY是主体,PT和RS两侧面是两翼。这两翼也都是广义作用与广义效应的综合体,理论上也可以制造描述性记忆,如“表:3侧面的描述与叙述表示”所示。不过,高明的语言面具制造者都明白,两翼描述可能赢得的震撼效应远不如主体描述。因此,两翼表述出现以叙述为主的态势可以说是语言脑的本色表现,这就是本节标题的理论依据了。

上一段7次使用了“两”字,此“两”又两中有两,即广义作用与广义效应各一。这一点,一定要明晰于心。

本节需要以科普语言说一说这些两中之两,这包括主体XY的两中之两。

在基本句类代码新表中,基本句类被分为3大类,其命名、编号及标记字母如下表所示:

 

表:基本句类空间交织性的简明呈现

命名       简称     编号            标记字母

广义作用   X型     X01-X30          X;T;R;D

两可       B型     B01-B18          X;T;Y;jD

广义效应   Y型     Y01-Y20          P;Y;S;T;R;jD;D    

 

此表(下文将简记为“表”)充分表明,在作用效应链的6环节或广义作用效应链的8环节中,过程P和状态S这两个环节最为“贞节”,没有“外遇”,另外6位都不老实,有“外遇”,其中的转移T简直就是一位“花花公子”。“表”实际上是广义作用效应各环节老实度的展现,汉语和英语在表述方式方面的大异与这里的老实度之间存在密切联系。这里特意用了“贞节”、“外遇”和“花花公子”这三个词语,不过是一个噱头,为了引发读者的兴趣。下文的正式论述并不照单全收,只留下带引号的“外遇”和“花花”。

汉语和英语在表述方式方面的大异集中表现为格式与样式、句蜕与块扩、句群结构与逻辑组合这3大方面,前文已对此进行过系统论述。下文将结合上述老实度,对两语种表述方式的大异给出下列5点“补充”。这里把补充加了引号,是由于考虑到,下面的许多话语是否与以往的论述重复,笔者自己也不大记得了。为了先给读者一个整体印象,下面将5点“补充”的标题集中宣示如下:

补充01:关于过程P和状态S的独特表现

补充02:关于效应Y的传奇“外遇”

补充03:关于转移T的可理解“花花”

补充04:关于关系R的可理解“外遇”

补充05:关于两可句类的记忆转换处理

——补充01:关于过程和状态的独特表现

过程句P和状态句S没有“外遇”,显得非常老实,同时,它们的样式也基本不存在变易形态,这是其老实性的又一呈现。过程与状态描述的老实性可能是不同语种的共性,这一共性对于机器翻译具有一定的实践意义,因为这时不需要考虑样式转换。但是,不同文明对过程和状态的理解可能存在比较大的差异,从而导致语言描述的差异,并进而导致不同语种的过程句和状态句可能存在句类偏好的大异。上述两方面的景象确实存在于英语和汉语这两种代表语言之间,也就是标题所指的独特表现。不言而喻,它应该放在更大的自然语言视野里进行考察,惜乎笔者没有这个能力。

——补充02:关于效应Y的传奇“外遇”

作用效应链的效应环节,HNC曾付出过最多思量。其概念树及延伸概念的设计最早完成,并保持着“不倒翁”的光荣外号,该外号意味着效应HNC描述的透齐性得到了一定程度的验证。这几句形而上话语放在这里似乎很不协调,但不得不说。因为记忆中的(XYD,XYN)将主要来于HNC所设定的效应环节,而且该环节的前两个效应三角[*02]更是主力中的主力。人类当下关心的重大话题无一不与这两个效应三角具有最紧密的联系,前文已引用过的奥巴马先生国情咨文明证了这一点,各国政府的工作报告也莫不如此。

应该指出,人类社会一直存在一个十分有趣的现象,那就是过度关注前两个效应三角,同时过度忽视第三个效应三角的价值。农业时代以来一直如此[*03],当下的态势不过是更为强烈而已。十分巧合的是,“表”里的Y“外遇”者不是“别人”,恰好就是第三个效应三角,它是双对象效应句(编号B17)这一名称的缘起。发现这一巧合是十多年前的事,困笔者良久,故这里以“传奇”修饰之,并将简称Y传奇。

Y传奇的理论和实践意义都值得略说。理论上需要略说两点:(1)第三个效应三角在效应概念树序列中处于靠后的位置,其交织性已大于纯净性,与关系概念林的交织尤为显著,故其广义对象语块GBK采取了YBm形态,与单向关系句的RBm相对应。(2)Y传奇的句类代码以Y牵头,依据两“凡以”原则,纯粹的双对象效应句将一律被纳入记忆XYN//YN。实践上也需要略说两点:(1)英语的双对象效应句表述优先于作用形态,汉语反之,优先于效应形态。因此,双对象效应句的汉英翻译,对形态转换要给予特别注意。(2)在思维与语言的关系方面,本《全书》曾多次对一些似是而非的经典论述表达过HNC的基本论点[*04]。不过,如果单就双对象效应句来说,经典论述的一项推论——汉语和汉字不适合于现代思维的中国特色判断,不能说没有一定道理。因为双对象效应句的实际运用可能更优先于广义作用形态,而不是广义效应形态。当然这只是一项预期,英语的记忆方式似乎更贴近这一预期,而汉语反之。这是一个比较奇特而神秘的话题,或许在补充06里有所呼应。

——补充03:关于转移T的可理解“花花”

在作用效应链的6//8个环节中,惟有转移T这一环节最“花花”,遍及基本句类的X型、B型和Y型。在30项X型句类中,转移句占据半壁江山,达15项。不过,在B型句类中,其占比没有那么高,为5/18,在Y型句类中则仅为2/20(1/10)。可见,转移T的“花花”决不是西门庆式的“花花”,不是简单的事出有因,而是更深刻的事有缘起。在作用效应链的6个环节中,转移T的主块特征独树一帜,在量的方面,惟有它要求4块俱全;在质的方面,对象B与内容C的分野,惟有它特别清晰。这意味着转移对象与转移内容的判断具有得天独厚的优势,是句类分析或语境分析极为珍贵的宝贝(先验知识)。自然语言的语句有一个从单主块形态到4主块形态的演进过程,其中包括2主块和3主块的演进,最终是4主块演进。4块演进的关键性缘起就是转移,而不是作用链的其他环节。

上面的论述是对转移世界知识的科普表述,是关于转移T的HNC认识。没有这些认识,就意味着还没有达到对作用效应链认识的“蓦然”。如果达到了这个“蓦然”,那么,对转移T的种种“花花”表现就会心中有数,不难理解了。因为那无非就是4类主块(BK,CK,EK,AK)之间的种种省略或融合,例如,传输句是TA省略,自身转移句是(TA,TC)融合,而替换句则是“(TA,TC)融合+TB省略”。

——补充04:关于关系R的可理解“外遇”

关系R也有自己独树一帜的东西,那就是单向性和双向性的鲜明区分。请注意,这里使用了“鲜明”二字,它意味着单向与双向并非关系的专利,但鲜明是它的专利。鲜明者,“外遇”缘起于双向也。该“外遇”仅有一次,那就是双向关系句RkJ(编号Y09)。可理解者,即指此也。

——补充05:关于两可句类的记忆转换处理

现代语言对夫妻有一个比喻说法,把夫妻双方的另一方叫做另一半,HNC对这个比喻说法很感兴趣,因为它不仅完全符合HNC关于半和整的定义[**05],也完全适用于作用效应链的3侧面描述,每一侧面就相当于一对夫妻或一个家庭。理论上,作用充当作用效应侧面的丈夫,效应则充当妻子;过程充当过程转移侧面的丈夫,转移则充当妻子;关系充当关系状态侧面的丈夫,状态则充当妻子。实践上,所谓的丈夫和妻子不过都是家庭的一种角色,而角色不仅可以转换或交换,甚至可以双肩挑,这种情况下的角色将统称第三种角色。用句类空间的语言来说,X型句类是丈夫充当主角,可名之X型语言家庭;Y型句类是妻子充当主角,可名之Y型家庭;B型句类是第三种角色充当主角,可名之B型家庭。HNC理论的“蓦然”贡献之一在于:它揭示出每一个语言家族[**06]都由3类语言家庭[**07]构成,这样,对数以万计的语言家族就可以用一个统一的模式,即(XY,PT,RS)模式加以描述。该“蓦然”的另一种表述方式就是:语言家族的描述模式也就是语言脑的记忆模式,这里要提醒的是,在所谓的“另一种表述方式”里,实际上隐藏着一项相当有趣的埋伏。那埋伏何在?读者不妨先自行思考一下。

那埋伏在于,语言理解和语言记忆将面对完全不同性质的挑战或语言脑奥秘。前者的主要挑战是,如何降伏潜藏于语言序列中的众多敌寇;后者的主要挑战是,如何规范3对夫妻或3类语言家庭的档案记录。降伏敌寇的工作属于语言理解,它必须仰赖3类语言家庭的辨认。规范档案记录则完全是另外一种性质的工作,它关注的是整个语言家族的全貌或整体景象,而不是家族内部各语言家庭的具体特征。这就是说,无论是哪一类语言家庭,夫妻双方是谁充当主角已经不重要了,重要的是该家庭对整个家族的贡献,语言记忆的责任只是把这些贡献都记录在案。

写到这里,本节的5点补充似乎可以结束了,但本节不能到此戛然而止[*a]。下面的论述不仅是本节的主体,也是本章的主体,甚至还是本编的主体。

那么,如此重要的论述,为什么安排在这么一个“上不着天,下不着地”的处所呢?回答是:无奈又无能。

作为一个语言家族整体面貌的记录,语言记忆的粗线条形态已经给出了,那就是:

      (DOM;(XYD,XYN,PT,RS)[n];BAC[n]) =: ABS =: (HNC4)

(XYD,XYN,PT,RS)[n] ::= ABS[n]

对上面的表示式,虽然使用了“语言脑记忆的粗线条形态”的说法,但HNC理论实际上把它看作是语言脑的记忆模板,可简称记忆模板。上节和本节的论述,实质上是围绕着这个记忆模板而展开的。记忆模板里的ABS[n]将被命名为主体记忆或记忆主体,BAC[n]将被命名为备注记忆或背景记忆。这两个命名,后文有呼应性说明。

记忆模板存在6项要素,这就是HNC理论对(HNC4)或摘要ABS的基本思考和基本结论。这6项要素,读者应该都不陌生,因为前面已给出了充分说明。这里需要补充说明的只是附加的符号[n],其含义相当于多个“特定”。详说如下:记忆由多项特定主体记忆ABS[n]和与之一一对应的特定背景记忆BAC[n]组成,特定者,对应于某一具体领域DOM之意也。

上面是关于“语言脑记忆的粗线条形态”的粗线条描述,下面试图把这个粗线条描述尽可能搞细一点,也就是试图对记忆模板进行细说。但力不从心,只好采取细说k-m的笨拙方式。其中的的“k”仅取1或2,k=1对应于主体记忆ABS[n];k=2对应于背景记忆BAC[n]。

细说1-1:在记忆里,同一领域的摘要数量是不确定的,有的很多,有的很少,甚至没有,这因人而异。但一般情况是,语言脑某一领域记忆的摘要有多项,每一项代表一次特定的摘要,这是记忆的基本特征。符号ABS反映这一基本特征,符号ABS[n]则代表一次特定的摘要。符号ABS与ABS[n]的差别相当于HNC爱好的两个词语——非分别说和分别说。

细说1-2:一项特定的摘要ABS[n]来于一次特定的读或听,这就提出了ABS[n]的排序问题。这个排序问题看似简单,但实际上并不能像计算机的堆栈那样处理。因为,如果出现读或听的重复情况,要不要进行相应的并合处理呢?能不能说,语言脑记忆肯定会适时或及时进行这一并合处理呢?回答应该是:Yes。但图灵脑能做到这一点吗?又如何作到呢?这似乎是个难题,其实不是,因为检查一下该领域是否被记忆过,问题就可以迎刃而解。当然,这里的“迎刃”并不那么轻松,在后续的细说里会有所呼应。

细说1-3:主体记忆ABS[n]形式上包含4项,实际上包含8项。这里也有排序问题,HNC约定:按照ABS[n]定义式所指示的顺序排列。这意味着ABS[n]就是一张规范表格,一次读或听所生成或更新的ABS[n],实际上只是在该表格里填写部分内容。开始时,该规范表格可能呈现出大量的空,经过多次填写以后,那些空才变成不空。ABS[n]的多次填写对应于心理学的记忆加强,但这里宁愿加一句下面的话:它强关联于细说1-2里提到的所谓难题。

细说1-4:主体记忆ABS[n]里每一项的符号表示究竟是个什么东西?这才是语言脑记忆的核心问题。然而,这个核心问题的答案却非常简明,其正式陈述是:那东西就是各种具体领域句类表示式或具体领域句类代码的再表示。我们知道,所谓的领域句类表示式或代码,无非就是一些特定的基本句类或混合句类表示式或代码。因此,这项正式陈述里的新东西就是那个再表示,或者说,记忆核心问题的答案就在这个再表示里。

记忆命题1:领域句类代码再表示的整体形态等同于一个具体的概念关联式或一位使者。

这里,把“领域句类代码的再表示”诠释为一个命题,一个等同性命题,被命名为记忆命题1,也就是一个关于“领域句类代码再表示的整体形态”的命题。该命题右方的内容是读者所熟悉的,这不过就是采取了以已知诠释未知的常规技巧或词典技巧。把这个技巧用在这里,效果却不寻常。那么,这里要不要给出几个示例,把这个不寻常的效果突出一下或展示一下?这可要让读者失望了,因为回答是:请参照下面的细说自行练习。

细说1-5:记忆命题1续谈1——再说记忆模板

概念关联式或使者把不同的概念以逻辑符号关联起来,句类代码实质上也是干着同样的事。不过,句类代码里的概念全部是主块,其主块符号,无论广义对象块GBK,还是特征块EK,它们都含有自身的内在逻辑。就GBK来说,XJ的A代表一般作用,相当于语言世界的上帝,而X0J的X0A则仅代表物理世界的作用,相当于语言世界的一位圣灵;RB1代表关系双方的主动方,相当于语言世界的一类施事,RB2代表被动方,相当于语言世界的一类受事;TB或TB2代表转移的终点,TB1代表转移的起点,TB3代表转移的路径或路途中的站点,三者都被命名为转移对象;TC被命名为转移内容,实际上正是被转移的对象,其中,T2C代表被转移物,T3C代表信息。就EK来说,X和Xm虽然都是作用,但其意义大不相同;T0与Tm(m≠0)的意义也大不相同,D与jD的意义更大不相同。这些,就不必一一列举了,总之,记忆模板的主体记忆ABS[n]仍然是广义对象语块GBK和特征语块EK的一个特定组合。不过,两类语块的符号形态则经历了又一次“面目全非”的巨变。这又一次实际上是第二次,第一次巨变缘起于从自然语言符号形态到HNC理解符号形态[*08]的变换,第二次则缘起于从HNC理解符号形态到HNC记忆符号形态的变换。面目全非这个修饰词语,第一次巨变当然是100%地当之无愧,第二次巨变肯定达不到这个程度,但依然是一次巨变。为引起读者的注意,就使出了一个带引号的“面目全非”。

这里还需要指出另一个要点,它关系到HNC记忆符号体系里的逻辑关联表示。在记忆模板里,EK本身的作用等同于记忆命题1里的逻辑关联符号,这就是说,领域句类代码再表示里的最高层级逻辑关联符号可以直接由EK转换而来。这里的“最高层级”和“转换而来”值得一说,前者意味着领域句类代码再表示式或记忆模板通常具有多层级的逻辑关联符号,后者意味着这些逻辑关联符号并不是EgK或ElK本身,而是其转换形态“y”[**09]。此“y”对应于“l00*y”里的“y”,在概念基元空间里,“l00*y”是其内使(概念关联式)经常采用的逻辑关联符号。

细说1-6:记忆命题1续谈2——三说记忆模板

记忆模板对多层级逻辑关联符号的运用,意味着记忆模板的结构类似于英语的高楼大厦,而不同于汉语的四合院结构。这一形而上思考的结果,似乎为“汉语不适合于现代思维”的怪论(将简称头号语言怪论[*aa])提供了炮弹。然而只是似乎而已,因为自然语言的高楼大厦和记忆结构的高楼大厦并不完全对应,同样需要进行转换处理。这一转换处理的要点可以归结为两项,一是去粗取精[*10],二是重新组合。重新组合的内容主要是下列三项:一是指代、重复与省略的变换处理;二是主辅变换的还原处理;三是记忆生成的累积处理,也称记忆更新处理。记忆的累积或更新,包括两项:一从SCD到ABS[n]的转换;二是从BAC到BAC[n]的转换。前两项处理属于语言理解处理过程的事,即语境分析SGA的事。第三项处理的两项转换则属于记忆生成过程的事,即语境生成ABS的事,是记忆模板处理的关键步骤之一,或者干脆就说是最关键的步骤,也无不可。下文将结合具体示例,对此给予进一步的说明。

现在,我们并没有汉语的四合院结构不利于上述两项转换处理的证据。所以,这里建议头号语言怪论的爱好者,最好是对记忆的转换处理做点实际研究,例如,考察一下以英语为母语者的记忆转换速率是否比以汉语为母语者快速。

细说1-7:记忆命题1续谈3——四说记忆模板

三说里为头号语言怪论提供了第一棵炮弹,这里再提供第二棵炮弹,它来于多元逻辑组合的布局特征。让我们来回顾一下英语和汉语在该布局特征方面的巨大差异,英语“永远” [*aaa]是核心要素在头部,而汉语永远是核心要素在尾部,因此,这两种代表性语言在进行机器翻译时,必须施行多元逻辑组合短语或语块的“换头术”处理。记忆模板里的GBK当然会存在大量的多元逻辑组合,HNC约定,其组合方式将向英语看齐,也就是说,核心要素将置于该组合结构的头部,而不是尾部。这样说来,在生成记忆模板时,英语似乎可以免除“换头术”的变换处理,而汉语则似乎必须进行这一处理。这“似乎”难道不是显而易见的真实么?这第二棵炮弹的有趣度是否大于第一棵?笔者无意深究,读者就把这两棵炮弹当作是语言脑记忆模板沙盘上的两枚棋子来思考吧。

细说1-m到此为止,从SIT变换到ABS[n]的有关具体问题都涉及到了。这“都”字,意味着其广度符合透齐性要求,但“涉及”二字,却回避了透齐性的深度侧面。这回避是刻意的,是无奈又无能的表现,然而,也是本《全书》的本色。因为,此深度侧面必然要跨出理论第一棒的范围,进入技术第二棒。细说1-m的撰写风格大体如此,并将在下面的细说中继续。

细说2-m涉及从语境单元SGU变换到记忆ABS的第二个环节:从(BACA,BACE)到BAC[n]的变换,该变换将简称背景变换,而细说1-m涉及的变换将简称情景变换。两变换的复杂度各有千秋,它反映在两者的各自细说清单里。在细说“2-m”之前,不妨先重复一下HNC关于语言理解和语言记忆的一些基本思考。

语言理解处理的关键步骤是语境分析SGA,语境分析的硬仗之一是揭开语言的面具或面纱,让语言显露真容,记忆生成也面临着同样性质的硬仗。打硬仗都需要相应的谋略和武器,揭开语言面具之战也不例外。但HNC为语言信息处理所需要的相应谋略和武器另外起一个名字——揭具。在语境分析之战时,该揭具是(BACA,BACE),在记忆生成之战时,该揭具是(XYD,XYN)。这两套揭具,已经给出了充分说明,请读者一定要了然于胸(即把握住要点),因为,对细说k-m的考察,都要以上述两揭具为立足点。下面就来进行“2-m”的细说。

细说2-1:BAC[n]是(BACA,BACE)的非分别说

本细说将从从“六何”说(何故、何事、何人、何地、何时、何如)[**11]说起,先说一下其透齐性的不足。

就透彻性来说,“六何”存在着范畴认识方面的失误,这个状况与词类说非常类似。显而易见,如果把“何故、何事、何如”纳入一个范畴,那么,“何人、何地、何时”就应该纳入另一个范畴。因为,前“三何”大体上可以说是ABS[n]的专属概念,但后“三何”则一定不能这么说,因为它们不仅会涉及ABS[n],也必然会涉及BAC[n]。

“人、地、时”之“三何”(即上述后“三何”)不仅有说//写者与听//读者的基本两分,还有不同句类里三者的巨大角色差异。基本两分的信息应纳入BAC[n],角色差异的信息则应纳入ABS[n]。这个话题虽然说来话长,但要点已经点到了。

就齐备性来说,“六何”说距离“蓦然”境界的差距就更大了。“六何”既远不足以反映语境单元情景SIT的要点,也远不足以反映语境单元背景BAC的要点。单就抽象概念与具体概念的基本划分来说,具体概念的物(w,jw,pw,…)竟然被“六何”遗忘了,偌大的两可概念阵营x也被遗忘了。单就后“三何”来说,它不过是综合逻辑概念s里一片概念林的一部分,那片概念林叫“条件s3”,在“六何”里,可以说(s1,s2,s4)统统都被遗忘了。当然,“六何”的“何事”包含面很宽,它可以包含人类社会的两类劳动,也大体可以包含第一类精神生活,但是,对第二和第三类精神生活就不能这么说了,它也许可以包含这两类精神生活浅层方面的全部内容,但深层方面最重要的东西,是不宜纳入“何事”的。我们不可以把“般若”和“上帝”的概念纳入“六何”,也不可以把孔子的“仁”和老子的“道”纳入“六何”,玄奘大师是深思过这一点的,“阿耨多罗三藐三菩提”的译文就是一项明显的证据。齐备性话题就写这些吧。

(BACA,BACE)是对后“三何”说的透齐性补充。在语境分析SGA的视野里,BACA与BACE两者的分别说固然非常重要;但在记忆生成ABS的视野里,两者的分别说却没有那么重要了。因为,在从SGU到ABS的变换中,仰赖于两者分别说的东西已经分别融合到主体记忆XYD和XYN里面去了,因此,(BACA,BACE)里未融合到主体记忆里的“残余”部分,就不必再搞什么分别说了。把两者统起来,搞一个非分别说,显然是一个明智而经济的选择。

这个统起来的背景以符号BAC[n]表示,被命名为备注记忆,因为它起着主体记忆ABS[n]的备注作用。

细说2-2:备注记忆家庭BAC[n]-o(o=(p;s;t))

本细说的汉语标题名称及其符号表示虽然都属于细节[*12],但需要先交代一下。

备注记忆家庭就是指“人、地、时”之“三何”,其符号表示将采取BAC[n]-o的形态。变量“o”的对应常量符号集合为(p*;wj2*;wj1*),代表“人、地、时”。下面进入细说的正文,说4点。一总说,二说人,三说地,四说时。

——总说BAC[n]-o

备注记忆里的“人、地、时”和主体记忆里的“人、地、时”不是一件同样的东西,而是两件不一样的东西。或者说,主体记忆和备注记忆各自拥有自己的“三何”,这个界限不容混淆。BAC[n]-o代表备注记忆里“人、地、时”拥有自己的基本特征,那就是前文说到的“说//写者与听//读者的基本两分”,但需要添加此两分的非分别说,即两分的综合。

——说人BAC[n]-p*

备注记忆里的“人”可划分成3大类:写者或说者;读者或听者;中介者。下文将简称写者、读者和介者。此三分类似于对偶概念的“m”三分,因为介者实际上就是写者与读者的综合。这样,备注记忆里“人”的符号表示就采用BAC[n]-p*m的形态

写者、读者和介者的细分,既繁琐,又交织。但是可以说,繁琐不是问题,交织才是问题。对于“BAC[n]-p*t”,HNC符号表示并不怕繁琐,但对交织还是有点怕,原因又有两点:(1)可能需要设置相应的使者;(2)可能已经跨入了专家知识的范畴。下文试给两个示例。

示例1:奥巴马的a25e25片段:

BAC[n]-p*1   ((ppa101\1,USA);((Obama);[奥巴马]))

BAC[n]-p*2   (p-a11a,USA)

BAC[n]-p*0   (gwa35(\k);(State of the Union address))

示例2:《战争风云》片段

BAC[n]-p*1   ((gpa41e22ac43,German);)

        BAC[n]-p*2   ()

BAC[n]-p*0   ((ppa31ba,USA);[•沃克]);(The Winds of War))

 

这两个示例试图传递下述基本论点:(1)语言脑记忆的主体符号不是自然符号本身,而是由自然语言转换而来的概念符号,如示例里的ppa101\1、p-a11a、gpa41e22ac43和ppa31ba。这些概念符号在不同母语的语言脑里是相同的,与母语无关,将命名为语言脑共相记忆符号,简称共相记忆符号。(2)自然语言的专名符号可直接进入语言脑记忆,如示例里的下列符号:

USA、((Obama);[奥巴马]))、(State of the Union address)

German、[•沃克]、(The Winds of War)

这些符号将命名为语言脑的殊相记忆符号,简称殊相记忆符号。(3)共相记忆符号载体的物理、化学和生理特征是语言脑的生态奥秘,这项生态奥秘也许是上帝最珍视的“知识产权”之一,虽然上帝一定欢迎其一切奥秘的探索者,但对于这项特殊的“知识产权”,人类的明智做法可能是:在探索该生态奥秘的同时,也致力于其功能奥秘的探索,这就是图灵先生的伟大思考。(4)HNC理论是图灵思考的忠实追随者,上列HNC符号就是语言脑共相记忆符号的对应载体。(5)HNC共相记忆符号不难与自然语言文字符号接轨,也不难与语音符号接轨。(6)示例实际上给出了记忆模板的描述形态或描述结构。

以上论述缘起于备注记忆里的“人”,但实际上是HNC理论探索要点的再述说,也是记忆要点的再述说。其基本原则不仅适用于全部备注记忆,也适用于主体记忆。

下面交代一下示例中的若干细节。其符号表示仅供第二棒接力者参考。

细节1:三类代表性语言的殊相概念符号将分别采取不同的括号予以表示,英语采取了圆小括号,汉语采取了方括号,阿拉伯语拟采用花括号。每类语言的子类区分可考虑后接[k](HNC的10进制数字表示)的方式。

细节2:记忆模板出现空项,乃是记忆的常态,但“人”之记忆有所不同,有两个特殊情况值得注意,一是空项出现于BAC[n]-p*2的位置,二是记忆者自己占据着该位置。前者见于示例2。

细节3:示例对BAC[n]-p*0记忆项给予了特殊照顾,如(State of the Union address)和(The Winds of War)。两者还可以变成下面的表示:

    ((State of the Union address);[国情咨文])

((The Winds of War);[战争风云])

为什么要对BAC[n]-p*0给予特殊照顾?这就要请读者回去再看一眼前面的“细说1-6”,那里提到了记忆模板处理的最关键步骤——记忆的累积或更新处理。该特殊照顾可以看作是 对特定记忆住户之[n]号内容的查询便利记录。如果该记录尚未出现过,那就施行“n=nmax+1”的内容项添加处理;如果该记录已经出现过,那就要施行[n]号内容的更新处理。下面,以上面的那段奥巴马国情咨文为例,给出稍微具体一些的说明。

那段咨文的记忆住户叫a25e25(积极经济治理),该住户对应于一个巨大的话题,通常是一个大户人家。在任何一篇国情咨文或政府工作报告里,都可能多次说到这个话题。这就是说,该记忆住户的某一特定[n]号内容在同一篇文字里会多次出现,特定[n]乃与同一篇文字或同一信息来源对应,多次出现意味着特定的[n]将多次呈现。对这个“多”,必须进行“归一”处理,即将多次呈现的[n]并合到同一个[n]里去,这就是所谓的记忆累积或更新处理。该项处理的关键举措就如同法律或人事活动中对有关对象的情况查询,BAC[n]-p*0的特殊照顾无非就是为记忆处理的情况查询提供一个方便条件。“[国情咨文]”和“[战争风云]”方便于汉语记忆住户的查询,“(State of the Union address)”和“(The Winds of War)”方便于英语记忆住户的查询。这方便,就好比是秃子头上的虱子,不是吗!

HNC把该项方便条件与“人”捆绑在一起,而不是与“地”和“时”捆绑在一起,这好理解。但是,为什么要与BAC[n]-p*0捆绑在一起,而不是与BAC[n]-p*1或BAC[n]-p*2捆绑在一起?这个问题不仅不难理解,且不必回答。因为它属于这样的一类问题,提出来就足够了,不必费神去解答。

说人的话题可以结束了。最后就便针对上述怪论要再次罗嗦一句,上面特意使用了“汉语记忆住户”和“英语记忆住户”的短语,在示例的记忆模板里,前者不过是以“国情咨文”和“战争风云”分别进行相应英语表示的替代。这样的替代,可能对记忆或思维产生可察觉的影响么?不妨想一想。

——说地BAC[n]-s*m

这里的“地”是场合的意思。这“地”,也可以同“人”一样进行“m”类型的对偶三分,这个意思用自然语言来表述比较累赘,不如下面的使者表示式:

BAC[n]-p*m := BAC[n]-s*m := BAC[n]-t*m

这就是说,BAC[n]-s*1对应于说者的场合,BAC[n]-s*2对应于读者的场合,BAC[n]-s*0对应于介者的场合。说、读、介三者与其场合之间存在着不同程度的密切联系。这一特定联系,有的属于世界知识,有的属于专家知识。例如,示例1的国情咨文一定在美国首都华盛顿的国会大厦宣读,它对应于BAC[n]-s*~0,属于世界知识。但是,示例2之《战争风云》所对应的BAC[n]-s*1则属于专家知识,而不属于世界知识。HNC的建议是:(1)该特定联系是否属于世界知识,一定要在记忆模板的BAC[n]-s*栏目里表示出来;(2)如果属于世界知识,那就必须加以表示。表示的方式无非是两种,一是捆绑于记忆模板的某一栏目,二是委任相应的使者。

在说人的示例里,捆绑方式仅用于BAC[n]-p*0,那只是示例而已,不是捆绑唯一性的约定。“地”之世界知识可以运用捆绑方式或使者方式,或两者并用,这是理论第一棒必须指出的原则。至于捆绑指向具体实施(即指向BAC[n]-s*m里的哪一位)问题,就留给技术第二棒接力者去处理吧。

——说时BAC[n]-t*m

BAC[n]-t*mBAC[n]-o*m家庭的老三,上面的使者表示式适用于他,关于老大和老二的基本论述也适用于他,那么,老三还有什么独特话题?回答是:没有。

但是,应该就这个话头,说一下BAC[n]-o*m符号里面的[n],它是记忆家族各户家庭的统一编号,对ABS、BAC、XYD、XYN、PT和RS都适用。HNC约定:[n]为10进制符号,不会与语言理解基因氨基酸的符号“n”相混淆,请技术第二棒接力者注意到这一点。以上不过是插话,正式话题是下面的记忆命题2。

记忆命题2:各记忆家庭的编号[n]取决于BAC[n]-t*2。

此命题的文字形式,如同记忆命题1一样,笔者自己也很不满意。所以,前文的“无奈又无能”短语是真心话。

记忆空间里不同记忆家族的分布景象,在不同记忆者的语言脑里可能存在天壤之别。某些语言脑里的显赫家族,在另一些语言脑里不过是普通平民,甚至是希腊文明意义下的奴隶或印度文明意义下的贱民,反之亦然。为什么要从记忆家族的显赫性、平民性和贱民性谈起呢?因为,这不仅牵涉到心理学的凸显问题[*13],也牵涉到记忆家庭的编号问题,最终还可能影响到记忆家族的排序问题。

语言脑里的各记忆家族最初都处于空状态,这应该是没有疑问的。但是,从空到不空的巨变,不同记忆者或不同语言脑是否仅仅取决于他们本人所特具的语境呢?答案是:Yes。这个答案多半让读者感到迷惑甚至震惊,不能不说一段下面的话。

HNC的语境既是内因与外因的分别说,也是两者的非分别说,与综合逻辑s概念树“语境条件s34”里的语境相对应。总之,依据HNC定义的语境,此“Yes”答案具有公理性。基于此答案,不妨先说几句形而上话语:语境的特具性等同于语境的无限性,但这一特具性或无限性只能在有限的语境单元舞台上展现,记忆是该展现的记录。接着再说几句形而下话语:这个记录很特别,很高明,现代监控技术再怎么发展也比不上它,即使未来的监控技术能达到学术和技术双重意义上的全息高度,也仍然比不上,如果我们继续以今天的纯粹形而下思维和方式探索大脑奥秘的话。

HNC仅形而上关注语言脑和语言记忆的奥秘,本章仅涉及记忆家族和记忆家庭的奥秘。奥秘的揭示离不开揭具,这里要强调指出的是,符号BAC[n]-o*就是备注记忆的基本揭具,而该揭具的核心“部件”就是BAC[n]-t*2。请读者对这里的两个“就是”多给一点注意,因为它代表了一项认识,该认识也许配不上“蓦然”这个词语,但应该相差无几。本节在推出记忆命题1之后,又推出记忆命题2,缘由即在于此。下面试用通俗的语言把记忆命题2再说一遍。

一个记忆家族的各户记忆家庭都居住在其记忆家族领地,这在原则上似乎是没有任何疑问的[*14]。但是,每一记忆家族领地的整体疆域如何描述?每一记忆家庭的住处(住宅的位置)又如何描述?记忆的形而上思考,必须回答这两个根本问题,前者曾略说了一下,下面略加呼应;后者还未曾提及,下面进行第一次略说。

呼应性略说归纳成下列5点:

1)记忆家族疆域的变动不会脱离自己的记忆部落和记忆国家。记忆国家与语境概念相对应,记忆部落与语境延伸概念的变量形态相对应。这意味着,记忆世界的空间景象很类似于农业时代农耕民族的社会,而不是游牧民族的社会,更不是现代的全球化社会。这样的比喻,必然遭到现代读者的嫌弃,那只好说一声抱歉了。

2)记忆家族不仅有豪强、精英、民众、游帮的基本区别,甚至还有绝户。人类社会虽然经历了从农业时代到后工业时代的巨大变迁,但“豪强、精英、民众、游帮、绝户”的基本景象并没有消失,它不会消失也不应该消失,而是必将随着地球村和人类的存在而存在。记忆世界和记忆家族的景象也是如此。

3)“豪强、精英、民众、游帮、绝户”[**15]代表记忆单元的5种景象(不是类型),但五者并不能直接作为记忆家族的标签,因为正常的语言脑都各自拥有自身的不同标准,此语言脑里的豪强可以是彼语言脑的游帮甚至绝户,反之亦然。但是,此景象可用于记忆家庭的描述,这将在下文说明。

4)如果把记忆单元的5种景象与语境单元的类别联系起来,那么,记忆空间景象的整体分布形态必然是语言脑智力水平的一种表征。这是一项不可忽视的世界知识,而心理学或许恰恰忽视了这一要点。

5)记忆空间的豪强与绝户现象特别值得注意,不同文明拥有各自的豪强与绝户特征,六个世界也是如此。这里愿意再次提醒读者关注一下政治理念d11和宗教q821这两株概念树,那里的豪强与绝户景象,特别令人触目惊心。

关于记忆家族的呼应性略说到此为止,略说中使用的术语未采用读者熟悉的词典意义,所以,请对注释“[**15]”多加关照。下面来略说记忆家庭及其住宅的描述问题。

让我们从搬家这个词语说起,这里的搬家就是指ABS[n]的[n]变动,此[n]的变动就是记忆家庭ABS[n]的搬家。此搬家现象应该是记忆空间的常态,甚至可以说每时每刻都可能发生。这是HNC记忆理论的一个重要命题,关系到HNC关于记忆的一项基本假定。

该基本假定的自然语言陈述是:(1)“豪强、精英、民众、游帮、绝户”的划分是HNC理论关于人的基本描述方式[**16],对这一描述方式,记忆家族、记忆家庭以及记忆家庭之住宅形态都可以借用。但借用时仅能充当形式标签,而不能充当内容标签。5种记忆住宅形态可依次名之豪宅、精宅、民宅、游宅和绝宅。(2)记忆家族的形式标签[*17] 与人之基本描述具有大体上的对应性,但与其记忆家庭的形式标签则不具有任何这种对应性。这就是说,任何人都会拥有5种形式标签的记忆家族,但其豪强和绝户记忆家庭却各自具有自己的独特性。这段话语大约不太容易理解,下面会采取使者的符号形式另加说明,请读者对照。

记忆的搬家就是指记忆家庭的住宅变动,搬向精宅就是记忆加强,搬向游宅就是淡忘,搬向绝宅就是遗忘。住在豪宅的记忆家庭比较少,属于“刻骨铭心”之类,多数记忆家庭应该是住在精宅和民宅里。

语言脑记忆搬家现象的实验研究似乎已具备足够的前提条件,但该项实验的设计和施行都比较复杂,这就不去说它了。但应该指出,图灵脑的记忆搬家现象则不难进行实验研究,因为我们可以随意对语言脑“电子白老鼠”(即微超)进行解剖或手术。此“鼠”前文曾多次预说,这里算是一次呼应吧。

笔者幼年和少年时,经历过“城市-农村-城市”的搬家,那也是一次初进祖宅和永离祖宅的搬家。成家以后,经历过从“绝户”(无住宅)到接近“精宅”的多次搬家。因此,搬家这个记忆家族的景象,在笔者语言脑里可能有点特别,它具有从豪宅到绝户的迭影,而语言脑的通常情况是:豪宅、精宅与民宅3类住户应占据搬家记忆家庭的显要位置,它们都对应于符号ABS[1](q746β)。下面对搬家所对应的记忆家族或记忆家庭,给出4位使者示例,相关的概念或术语出现在4位使者的队伍里。

ABS[1](q746β) := r4075——[ABS(q746β)-01]

(搬家记忆家庭的1号住户对应于自身)

          ABS((~c)746+pj52*) = a15——[ABS(q746)-01]

          (在农业和工业时代,民族迁徙记忆强交式关联于征服活动)

          ABS(c746,l44,pj2*) := jru73c01——[ABS(q746)-02]

(在后工业时代,移民记忆属于常态)

ABS(q746β) = p56b3d5m——[ABS(q746β)-01-0]

(搬家的记忆家族强交式关联于人之基本描述)

 

针对这4位使者,需要说3段话。(1)第一位使者很特别,只有它带有符号“[1]”,表示它是记忆空间必须派出的外使。(2)不带符号“[n]”的记忆空间外使都可以变成概念基元空间的内使,那么,语言脑或未来的图灵脑需要配置两套使者么?(3)最后1位使者是特使,前3位使者所传递的世界知识都比较普通,但这位特使不同,它所传递的世界知识非常纠结。那么,如何对这一纠结性世界知识进行解构处理?

对上述两个问题,纯粹的形而上思考或许无能为力,因而也难以达到“蓦然”境界。不过,这里愿意对那位特使说几句话:它可以变成记忆家庭的形式,那就是将“ABS”改写成“ABS[n]”;该特使是对一个奇特(难以理解)论点的呼应,那就是:人之基本描述与其记忆家族的形式标签具有大体上的对应性,但与其记忆家庭的形式标签则不具有任何对应性

从搬家这个词语说起”的话题拟到此结束。其预期目标是:对HNC理论引入的记忆家族和记忆家庭这两个重要概念或术语,给出一个比较鲜活的素描形象。这个目标达到了么?笔者并没有多少把握。

不过,细心的读者可以察觉到:“说时BAC[n]-t*m”论述里的漏洞远多于前面的两“说”。

漏洞有大节(j721)与小节(j722)之分,但这两者的区分在形而上和形而下的视野里往往截然不同。下面将不理睬这些,就漏洞问题略说两点。

1)关于编号[n]的漏洞

上文说到记忆家族和记忆家庭的形式标签,其符号表示最终落实为编号[n],它是记忆家族和记忆家庭的共享编号,可名之一级编号,而记忆家庭还需要二级编号,不过上文没有明说。对于这个解释,敏感的读者立马会提出反问:上面的第一位使者仅使用共享编号“[1]”,然而却被命名为“搬家记忆家庭的1号住户”,二级编号何在?这就是关于编号[n]的漏洞。

此漏洞的考察要与该使者的特殊身份——搬家——联系起来。搬家这个概念对于言语脑和图灵脑存在十分独特的差异,言语脑通过其承载者可以获得搬家的亲身感受,而图灵脑不可能有这种感受。这意味着:与搬家这个记忆家族相联系的“记忆家庭1号住户”这个概念,对于言语脑显得比较自然,对于图灵脑则显得相当各色。言语脑的搬家“记忆家庭1号住户”似乎不需要二级编号,但图灵脑不同,领域符号本身可能不足以提供该住户的身份(从豪强到绝户)信息,这就需要二级编号的支持。总之,记忆家庭之一级与二级编号的概念,可能更适用于图灵脑,而并不完全适用于言语脑。但是二级编号果真不存在于实际言语脑之中么?这个问题似乎过于玄妙,可暂不探求。这些问题的进一步探索,纳入技术第二棒的范畴比较合适。

没有任何理由认定:记忆家庭住宅区的景象类似于人类社会住宅区的景象;但也任何理由认定:这两种景象之间不具有某种相似性,例如富豪区和棚户区的鲜明对照。承认某种相似性的存在是一种比较明智的的选择或思考。记忆家族和记忆家庭术语的引入,本节的一切论述,都是此项选择或思考的必然产物。这一点,务请读者注意。

2)关于记忆命题2的漏洞

该命题说:“各记忆家庭的编号[n]取决于BAC[n]-t*2”。这里的漏洞不是一个,而是两个。一是关于“[n]”的漏洞,上文已经说过了;二是关于“*2”的漏洞,显然,把它改成“*2//”的更为适当。记忆是图灵脑作为读者而形成的效应物(rw),这正是符号“*2”试图传递的信息。但言语脑不仅是读者,也可以充当写者或介者,这就是符号“*2//”可以传递的信息了。当然,一位成熟的语超也可以充当写者或介者,甚至是非常高明的介者,但那毕竟是十分遥远或渺茫的事。此中的心情巨变[*b],不可能不对本《全书》的撰写产生深刻影响。这里的漏洞与这种影响之间存在微妙的联系。

下面对本节略作回顾,它可以划分为两大段:段1和段2。两大段本来可以划分成两个小节,为了遵守本编约定,就没有这么做。段1论述了记忆6要素或记忆模板;段2论述了记忆家族与记忆家庭。记忆6要素也可以表述成记忆3要素:领域DOM、主体记忆ABS[n]和备注记忆BAC[n],但论述中回避了“3要素”表述。这里有两点考虑:一是把领域与另外的5项或2项并列为要素之一,在严格的理论意义上并不妥当;二是试图突出对XY的特殊优待,惟有它,被赋予XYD与XYN的划分。任何理论的透齐性都存在一定前提,HNC记忆理论当然也不例外。段1着重于阐释HNC记忆理论的透齐性,但段2也涉及到其现有形态的不足。所以,本节多次使用了理论第一棒和技术第二棒的说法。

最后应该说一声,本节的注释比较重要,请一定要同步阅读,特别是其中的带“**”部分。对注释区分“*”和“**”两类,但对两者统一编号。本节或许是第一次这么做,往事已矣,来者可追。这八个字的文言表述,就当作是本节的结束语吧。

 

注释

[*a] 这里也许是第二次使用“戛然而止”这个词语,本编的第一次使用是在第一章第1节的末尾处,那里说“可以”,这里说“不能”。为什么?这多少有点微妙,请读者玩味。

[*aa] 头号语言怪论是中华文明断裂的一项不俗表现,流行于中国,特别是中国大陆,历久不衰,在博客里还可以经常见到,且支持者不少。该怪论的提出与奠定要归功于许多人,中国的许多著名人文学者是当然的主力,但外国人文学者也起过重要作用,其中的某国学者还得到过某国政府的大力支持。

[*aaa] 这里,对永远特意加了引号,因为现代英语已有例外,某些多元逻辑组合方式居然出现了向汉语看齐的趋向。当然,该趋向目前仅限于一些特定情况,主要是某些专用复合概念的表述。

[*b] 此话语显得比较突兀,请参阅[340-11]节。

[*01] 语言理解基因“天字1号”氨基酸的说法是第一次使用,将来可能引入“天字m号”、“地字m号”和“人字m号”等名称。“天地人”将分别用于语言理解基因第一、第二和第三类氨基酸的区分,这样做可能有利于科普。语言理解基因氨基酸的论述最早见于预说,在“期望行为7301\21”的子节结束语里,该子节编号为[123-0.1.2.3],可参阅。

[*02] 效应三角是效应概念林独有的概念树分布现象,共计3个。第一个指“生与灭、利与害、显与隐”3株概念树,第二个指“增与减、立与破、调控”3株概念树,第三个指“连与断,选择、聚与散”。后两个效应三角的概念树汉语命名各有一个不带“与”字,那就是“调控”和“选择”,但两者序位不同,很不协调。显然,把第三个效应三角里的“选择”换到老三的位置比较合适,考虑到木已成舟,采取了维护不倒翁形象的保守做法,但这项思考仍然值得告知道读者。

[*03] 这里“一直如此”说具有比较大的片面性,因为佛学特别重视第三个效应三角,前文曾说过,《心经》里的“不垢不净”就是指第三个效应三角。佛学的般若智慧主要就是教导人们懂得放弃,而放弃是第三个效应三角的核心理念。

[*04] 此说的理论依据来于自然语言空间和语言概念空间的本质区别,前者拥有一套规则,而不是原则,该规则主要用于语言生成,与语言理解无关。后者拥有一套原则,以原则指导相应的规则系统,该原则与规则主要用于语言理解,并支持语言生成。语言与思维的关系主要涉及语言理解而不是语言生成,脱离这个要点的论说就难以避免似是而非的弱点,在…里,曾对此有所论述。

[**05] 这个比喻里的夫妻双方对应于“整j41-c22”,另一方对应于“半j41-c21”。这个比喻说法似乎只适用于采取一夫一妻婚姻制度的社会,其实不然。因为对于半,可以施行j41-c21\k的延伸,如果其中的“k”含根概念,可用于妻妾婚姻制度的描述;不含根概念,可用于多妻(或多夫)婚姻制度的描述。

[**06] 本编的语言家族与上一编的语境单元完全对应,语言家族就是语境单元的科普描述。

[**07] “3类语言家庭”说实际上是“4类语言家庭”说的简化。第4类语言家庭是(D,jD),这读者应不难想到。下1节将对该语言家庭作专门论述。

[*08] “HNC理解符号形态”这个短语大约是第一次采用,但读者应该能够心领神会,所以这里就不解释了。该短语里的两个关键词是“HNC”和“理解符号”,如果对两者的组合词语加以解释,那显然是对读者的大不尊重。

[**09] 这里的“y”是充当逻辑关联角色的HNC记忆符号,不带五元组符号,实则是对v之省略,这是约定。从这个意义上说,动词中心论确有其一定道理。EK的自然语言形态经常采用带EH的复合结构,还会出现分离现象,这属于自然语言的繁琐。在这一点上,英语和汉语差异不大,大哥莫说二哥,但“y”可以免除此类繁琐。

[*10] 去粗取精的内容比较复杂,需要专题探索。语言脑的质量在很大程度上决定其“去粗取精”的水平,有人比较关注细节,有人善于抓住要害。这些,是记忆个性特征或殊相呈现的重要内容,因而也应该是记忆研究的重要内容,但似乎还是空白。

[**11] “六何”说是陈望道先生于20世纪30年代提出来的,英语世界有相应的“[m]W”说,这里的[m]是HNC使用的10进制数字表示符号,读者不会感到生疏吧。在HNC的视野里,“六何”和“[m]W”的根本基本弱点在于:既未区分语言理解处理过程的情景SIT与背景BAC,又未区分语言记忆生成过程的主体记忆ABS[n]与备注记忆BAC[n]。仅从“六何”和“[m]W”的排序来说,这一根本弱点就已经暴露无遗了。对于每一个“何”或“W”的阐释或分析,未超出词典的水平,距离透齐性的标准还比较远。HNC在第一次引用“六何”说(见《定理》p36)时,没有说这些话,那是有意回避。

[*12] 这里的细节除了其通常的词典意义之外,还有一项笔者赋予的一项特定含义:临时性约定,服务于行文之便,不影响“第二棒技术”的修改自主权。“第二棒技术”或“第一棒理论”属于HNC语言,特意加了引号,其含义读者应该明白,无须解释。

[*13] 凸显问题…

[*14] 家庭住处位于家族领地的说法,在农业时代都不完全适用,何况现代?所以,这句话使用了“原则上”和“似乎”的修饰词语。但对于记忆家庭和记忆家族,这两个修饰词语或许并不需要。这是一个很有趣的形而上课题,是神经生理学的形而上课题。在神经胜利学专家的视野里,此课题无疑属于无聊的蠢话,但笔者宁愿说一句更蠢的蠢话,神经错乱的原因之一就是:许多记忆家庭乱搬家,离开了其记忆家族的领地,从而造成思维的混乱。

[**15] 对记忆家族和记忆家庭使用这一组比喻术语,一些读者可能感到很不习惯,这里依次略加叙说。这里的豪强不是词典意义的豪强,是指社会金字塔的顶层人物,例如农业时代的贵族和高级官员,部落或宗教团体的领袖,现代社会第一世界的金帅、第二世界的官帅和第四的教帅更是豪强的范例。精英和民众的意义也大不同于词典,前者是指第二类劳动的主体承担者,对应于中国封建社会“士农工商”里的“士”与“商”,对应于现代全球意义下的中产阶层。后者是第一类劳动的主体承担者,对应于中国封建社会“士农工商”里的“农”与“工”。游帮是笔者与池毓焕博士在“二人沙龙”中想出来的名词,接近于金庸先生小说里的丐帮,是“精英+民众”集合的异类。绝户的意义也不同于词典,比较接近于孔夫子“兴灭国,继绝世,举逸民”乌托邦主张里的逸民。不同社会的游帮和逸民各有自己的特点,六个世界皆然。20世纪的中国,曾出现过两位著名的绝户代表,本《全书》都不止一次提到过,第一位是辜鸿铭先生,第二位是陈寅恪先生。21世纪的中国也可能出现绝户代表,前文提到过的王康先生,很有希望入选。最令人不安的是,2千年来,曾充当中华文明脊梁的儒家、佛学和道教,都可能沦为大陆中国的绝户。“民”、“人民”、“公民”、“群众”、“大众”这些概念或术语是对“精英、民众、游帮和绝户”的非分别说,也是“士农工商”的非分别说,有时甚至还可以把“豪强”和“高官”都包括进来。这些术语含有丰富的智慧和高明的谋略,容易为编织语言面具的高手所滥用,故本《全书》很少使用,其HNC符号是40\12~e51,意义也不同于词典。

[**16] 人之基本描述的HNC符号如下:

p56b3d5m      人之基本描述

p56b3d51      豪强

p56b3d52      精英

p56b3d53      民众

p56b3d54      游帮

p56b3d55      绝户

符号56b3d5m是符号56b3okm的形态之一。后者的汉语表述是“社会等级的弱不公正划分”,前者具有下列使者:

 56b3d51 ≡ q742

(豪强强关联于别居)

 56b3d52 = q742

(精英强交式关联于别居)

         ((6b3d54,56b3d55),jl00e22,q742)

        (游帮与绝户无关于别居)

[*17] 这里对记忆家族和记忆家庭都赋予了“形式标签”的术语,该术语的意思相当于城市里各类市区的名称和编号。这里似乎需要强调一下,记忆空间的家族和家庭是广义的,市区类型里的行政、商业、制造、金融、教育、科研、居民…等复杂区分,不过是记忆家族或记忆家庭的一部分,甚至只是一碟小菜而已,因为它们都可以通过记忆6要素里的第一要素(领域DOM)来加以精细描述。

 

 

第三卷 第四编 第二章 3节

 

广义作用效应链之判断侧面在记忆中的角色

D句类和jD句类在记忆转换处理中的特殊角色)

 

从作用效应链到广义作用效应链的发展是HNC探索历程中的一次“蓦然”,这在前文已经论述过了。但本节需要回顾一下该“蓦然”的要点,那就是把概念基元的两个子范畴分别纳入广义作用与广义效应这两个基本侧面。那两个子范畴分别是“思维8”和“基本逻辑jl”,两者对应于本节标题里的“判断侧面”,并与另一个子范畴“综合逻辑s”强关联,所谓“判断侧面在记忆中的角色”与这项世界知识密切相关。

上节通过逻辑符号“=:”给出了记忆模板ABS或(HNC4)的定义式,同时给出了主体记忆ABS[n]和备注记忆BAC[n]的定义式和相应的说明。这些定义式及其说明是HNC记忆理论终极形式的表述,与此前的表述略有不同[*01]。

HNC理论比较熟悉的读者可能发问:在(HNC4)的原初形态里,“判断侧面”赫然存在,而在所谓的终极形式里,却隐而未见。发问者可能会产生一种“屡错屡改何时了”的感叹,甚至会产生一种“今不如昔”的错觉,笔者本人也经常遇到这种情况。在一个漫长的探索历程中,那感叹,多数是思考过程的正常涨落现象;那错觉,则多数是思维惯性作祟的结果。在记忆模板的定义式里,XYD和XYN的引入,就意味着“判断侧面”的赫然存在。在记忆家庭类型的阐释里,对“3类语言家庭”说特意附加了一个带“**”的注释,那里明确指出了还有一个第四类语言家庭,其两位基本成员是(D,jD),两者分别与“思维8”和“基本逻辑jl”直接对应。这两项对应关系就是两位外使,是句类空间和概念基元空间之间的普通外使,不是特级外使。如果以前不曾介绍过他们,读者应该有一种“见面熟”的感觉,表示式就免写了,这样做不过分吧。

下面先略说一下第四类语言家庭的两位基本成员:D和jD。

上节一开始,给出了“表:基本句类空间交织性的简明呈现”,使用了“外遇”和“花花”这两个不“雅观”的词语,用以描述表中3类语言家庭基本成员的状况,但没有提及D和jD。现在回过去看一眼就知道,第四类语言家庭的这两位基本成员也都有“外遇”表现。不过,两者的“外遇”问题并不严重,都属于可理解类型,查看一下基本句类新表就一清二楚[*02]了。这里要指出的是:语境分析和记忆转换的关注点应有所不同,前者应优先关注“外遇”问题,而后者则应优先关注语言面具性问题,尤其是jD。这里顺便再说一声,语言面具的高明编织者都是运用jDJ和jD1J的高手,这两个基本句类在英语和汉语这两种代表语言里有截然不同的样式呈现,这是一个十分有趣的课题,似乎未引起语言学界应有的重视[*03]。

“外遇”和语言面具性是两个不同性质的问题,为什么这里放在一起来讨论?这是基于下述思考:在记忆转换处理中,两者是纠结在一起的。不过在正式讨论前,不妨先回顾一下“D句类”和“jD句类”的基本情况。前者在广义作用句X-m中占有(3+1)个席位[**04],在广义效应句Y-m中另占两个席位。后者在广义效应句Y-m中占有8个席位,在两可句类B-m中另占1个席位。另占就属于“外遇”。

在语境分析环节,领域句类具有“可求而不可遇”的特征,如果对这一特征不给予充分重视,那就谈不上什么语言信息的灵巧性处理。这一点,前文曾多次提及,在《微超论》里将作比较系统的说明。这里仅就上面引用的奥巴马国情咨文片段,说一段便于激活感性认识的话语。

在那一小段咨文语料的描述中,明确指出其领域属于概念树“经济与政府a25”的一级延伸概念“a25e25积极经济治理”,并依据这一关键信息对英语语料给出了比较完整的一级标注,同时写下了如下的带马虎眼话语:

这里的每一个相关语句都没有预期领域的直系词语。但此项难题的解决,在这里可谓轻而易举,因为那不过是一项原则[*09]的简单运用

这里的马虎眼不仅有“一项原则”,还有“轻而易举”,两者紧密相关。配合这个马虎眼,那里还故意隐瞒了两项关键信息:一是领域a25e25拥有直系捆绑词语:汉语的国情咨文、政府工作报告…等就是;二是领域a25e25具有丰富而又不难辨认的复合领域,该段语料可以比较轻松地纳入复合领域“a25e25+a219\2”。所谓的“一项原则”,就是指“三看齐”原则的未知向已知看齐,此已知直接来于标题,标题提供的语境信息可全文使用,“轻而易举”的依据就在这里。当然,不是所有的标题都直接提供语境信息,标题语境信息的运用也不是一个“未知向已知看齐”可以完全概括的。这里仅强调指出:复合领域和三看齐的话题里存在许多十分有趣的课题,而且是理论第一棒的课题,但不宜在这里展开,让后来者去探索吧。

以上所述,属于本节的铺垫。下面还要再加一个关于领域句类代码的话题,说两点。一是领域句类代码通常并不具有唯一性,但一定具有优先性;二是同一个句类代码可以为不同领域所共享,这种共享现象是交织性的一种必然呈现,而强交织性存在于不同领域之间乃是语言概念空间最壮丽的景象[**05]。

下面,可以进入本节的主题了,共3大点,分别以要点O-m标记。要点0-m依然具有铺垫特征;要点1-m面对D句类;要点2-m面对jD句类。其中的要点1-0和要点2-0是总纲,后续的“要点O-m”(O=(1;2),m≥1)是总纲的分别说。

各要点的论述,将主要采取问答形式,这更加符合探索的语境需求。但有意含糊问者的身份,因为可以是自问。

要点0-1:主体记忆ABS[n]定义式包含的核心思考

描述与叙述的区分是主体记忆ABS[n]的核心概念,但基于此,并未引申出ABS[n]的6要素说,而是4要素说,这是主体记忆ABS[n]定义式的基本约定。约定不同于规定,它可以拥有更大的灵活性或变通性,其具体呈现前文已给出了交代。

主体记忆的基本约定试图反映这样一条世界知识,那就是:作用效应侧面XY的描述与叙述之分特别重要,因为它是识破语言面具的关键性揭具。过程转移侧面PT和关系状态侧面RS当然也有描述与叙述的区分,但先可以置之不理,也就是不进入记忆,因为它们都不是关键性揭具。任何事物的任何争论,归根结底,都是在围绕着该事物的作用效应侧面XY打转,在总体上,过程转移侧面PT和关系状态侧面RS都处于附属地位。

要点0-2 备注记忆BAC[n]与D句类或jD句类都没有直接联系。

这是一个急所性课题,但留给后来者。

要点1-0:描述与叙述的区分能以D句类的出现与否为基本判据么?

这是要点论述的第一次使用问句,这此比较特别,带着很重的忐忑心态,为什么?因为HNC一直没有把D句类的特殊性说清楚。下面的论述需要D句类的HNC符号表示,顺便把jD句类也带上。

 

         表:D句类和jD句类的HNC符号表示及其特使[**06]

 

        汉语名称        HNC符号            相关特使

        D句类           SC(D)//SC(DO)      SC(D) ≡ 8

            jD句类          SC(jD)//SC(jDO)   SC(jD) ≡ jly

 

表中的第一位特使非常特异,它指明:D句类仅与概念子范畴“思维8”强关联,其子类与“思维8”的概念林不发生直接联系,更不用说概念树了。从这个意义上可以说,D句类是基本句类中唯一的特异句类,因为其他基本句类都拥有与其概念树直接对应的子类,包括jD句类。对语言概念空间的这一特异现象,前文曾有所解释,但笔者本人也并不满意。要点1-0的忐忑即缘起于此,忐忑里又抱着一种招来凤凰的期盼。这里的所谓凤凰就是指下面的“要点1-m”(m≥1),梦在招来,略说为引,采用问答方式。本节下面的论述,都照此办理。

要点1-1:“思维8”这个子范畴包含6片概念林和20株概念树(其一为虚设,实际是19株)。HNC对概念林与概念树的布设都遵循“纯净度递减,交织度递加”原则,该原则(可简称两递原则)在这里依然适用么?答案是:Yes。但是,两递原则与句类的对应性特征[*07]在D句类里却荡然无存,每一D句类原则上适用于“思维8”的任何一片概念林或任何一株概念树。那么,某一特定D句类是否就不存在概念林或概念树的优先倾向?大体上可以这么说,但新增的D02J例外。

要点1-2:所有的D句类都强关联于描述,不带语块DA的D句类也不例外。说一句不文雅的话吧,只有傻瓜才会把D句类所给出的陈述当作是叙述。

上面的不文雅话语在于强调:D句类是明码实价的描述,语境分析和记忆转换处理首先要抓住这个要点。所谓“不带语块DA的D句类”,好比是犹抱琵琶半遮面,要点1-2不过是为未来的图灵脑提供一件揭具,以便拿掉那只琵琶。

言语脑的叙述与描述错位现象非常严重,这是智力误判的重要原因之一。对未来的图灵脑当然不宜苛求,但也不宜过于低就,拿掉琵琶之说即缘起于此。否则,图灵脑可能成为增加言语脑错误或低水平判断的帮凶,而不是减少错误或低水平判断的有益助手。这段话,如同痴人说梦,但请勿见笑。当大数据的辉煌终于显示出其巨大局限性时,人们会回过头来重新思考:图灵脑真的就不能实现么?

要点1-3:D句类有两名“外遇”,被纳入广义效应句Y-m[*08],他们也强关联于描述么?答案依然是:Yes。为什么?因为它们是省略了DA的句类,其中的两主块简明判断句D1J还是一个将BK与CK融合在一起的句类,如此而已。此说过于粗线条,细线条论述留给后来者,这包括英语和汉语的差异性表现。顺便说一声,此课题属于大官子,不是急所。

要点1-4:为什么基本句类新表要对D句类的广义作用句增加一个子类?为什么不把它放到两可句类B-m里去呢?这又回到了叙述与描述的错位问题,不过这里将换一个角度来考察,从标签这个词语说起,此标签不是词典意义的标签,而是一个复合概念,其HNC符号是:

        (23\6,l10,2398bju731)

        (标签是关于一种特定论述的标记)[**09]

人类社会一直受到各种标签的困扰,当然,困扰只是标签效应的一个侧面,远非全部。标签也可以是一种高级享受品,享受者不仅不会感到困扰,甚至感到快意。多数被困扰者也不会感受到这种困扰,要么是该困扰本身变成了他们自身的一种观念,要么是把该困扰当作是一种理性来对待。因此,这里的所谓“标签困扰”,其基本含义有下列3点:(1)少数人在制造或灵巧运用一些标签;(2)很多人愿意信奉此类标签;(3)许多人把此类标签等同于真理。从这个意义上也许可以说,教徒与非教徒并不存在本质区别,只不过两者所信奉的标签有所不同而已。

上述3点的前两点属于叙述,第三点则属于描述[*10]。标签困扰的要害恰恰在于标签的描述性,句类新表所添加的双对象判断句D02J可以把这种描述性发挥到极致。笔者这一代中国人都十分熟悉下列短语:“资产阶级知识分子”、“臭老九”、“走资派”等,这些短语都具有描述的极致性,曾发挥过巨大的语用力量。但我们可能没有注意到,这些短语其实都是D02J的浓缩品,都涉及到关于某种对象的类型判断,就是把一组对象与一类对象捆绑在一起或等同起来。这种捆绑属于一种判断,属于思维8的最后一株概念树“‘共识”843”,其HNC符号及汉语直系捆绑词语如下:

843d31      认定

双对象判断句D02J的基本特点在于:(1)判断的正确与否不是第一位的,捆绑的技巧才是第一位的。(2)判断者深深隐藏于幕后,不直接现身。这两点相互支撑,构成该句类捆绑技巧的要点,那就是:彻底抛弃作用效应链的面体说,而以点线说进行替代。就上面的三个短语来说,它们所对应的语句[*11]有一个共同特点,那就是只抓住对象(知识分子和官员)的关系或状态环节,而完全置另外5个环节于不顾。在HNC视野里,这就是典型的纯点说[*12]。纯点说需要高明的捆绑技巧,且语用力量巨大,注释“[*11]”里的3个例句也许可以提供一点佐证。判断的纯点说需要一个陈述平台,那就是双对象判断句D02J。同时,它本身也是一只琵琶,一件揭具,HNC不过是“借力使劲”而已。基于此,D02J被编号为X-22就是HNC的必然选择了。

在某种意义上可以说,新增句类D02J乃是思维概念树843的专利。

要点1-5:D句类的3位主要代表是D0J、D01J和DJ,上面的论述却避开了它们,仅论及D句类的3位异类:D02J、D1J和D2J。这是为什么?

如果把3位主要代表比作是朗朗乾坤,那3位异类就好比是重霾黑夜。上面针对后者,描绘了一幅走向光明出口的路线图。至于该描述是否到位,那是另外一个性质的问题:理论第一棒与技术第二棒相互交接的问题,这里只能抱歉了。

下面该说一下那朗朗乾坤的事了。D句类的3位主要代表分别展示了广义作用句的3项基本法则:最少3主块法则、最多4主块法则和块扩法则,这3项基本法则对应于广义作用句的3种基本句式:3主块句、4主块句和块扩句。块扩现象仅发生在广义作用句的某些特定句类身上,其承载者一定是基本句式的最后一个语块(GBK2或GBK3),而绝不可能是第一个(GBK1)。以上所说,属于句类知识ABC,要考察D句类的朗朗乾坤现象,就要紧紧抓住这3项句类知识ABC[**13]。下面,给出这一考察结果的初步清单,分别以结果0m(m=1-4)进行标记。

结果01:3位主要代表的DA都不能省略,该DA是主体记忆的特级贵宾[*14]。对这位贵宾,决不能慢待。这个态度,要在句类分析、语境分析和记忆转换这3个处理阶段一以贯之。

结果02:3位主要代表都有可能进入思维8的任何一株概念树。或以基本句类的形式直接进入,或以混合句类的形式间接进入。

结果03:3位主要代表的混合句类应主要采用DO形态,罕用甚至不用OD形态。这是一项始终伴随着HNC探索历程的困扰,该困扰对于技术第二棒的影响又始终处于不明朗状态,似乎仅具有理论意义,故其深入探索将继续搁置。

结果04:3位主要代表及其DO形态混合句类对于“思维8”的不同概念树可能具有不同的分布形态或所谓的优先性,这是一个大官子性质的理论第一棒课题,但一直处于搁置状态。由于“思维8”这一概念子范畴的撰写日程安排在后面,该课题的研究似乎缺乏前提条件,这是完全错误的认识。“思维8”各片概念林和各株概念树的设置早已敲定,该课题的探索不必等待有关概念树的概念延伸结构表示式。

下面转向要点2-m。

要点2-0:最常用的两种jD句类是否貌似叙述而实为描述?

最常用的两种jD句类指jDJ(是否判断句)和jD1J(有无判断句或存在判断句),将合称简易判断句。如果说小孩最早学会的语句一定少不了简易判断句,大约不会有太大的反对意见。但如果说,即使在小孩的语言里,简易判断句也未必是叙述,恐怕就没有那么幸运了。

这里是故意提出这么一个怪异的问题,奢望引发读者对下列问题的思考兴趣。在语言脑的记忆里,是否存在大量的简易判断句?绝大数言语脑是否都把简易判断句误认为是叙述,而不是描述?如果是,那是否意味着语言脑本身始终在演出一场宏伟的悲剧?人类社会的许多宏伟悲剧是否与此有密切联系?

要点2-1:“基本逻辑jl”包含2片概念林和6株概念树,为什么jD基本句类的总数不是6而是9?

基本句类有生母与养母之分,生母对应于“作用效应链φy”[*16],养母对应于“思维8y”和基本逻辑jly”。生母的孩子形成六大句类家族,其家族成员与“φy”的概念林和概念树直接挂钩是理所当然或顺理成章的事。养母的孩子形成两大句类家族,其中一个家族(D句类)的家族成员分工清晰,都不与“8”的概念林和概念树直接挂钩,这也可以理解。但是,另一个家族(jD句类)给人的印象却大不相同,各家族成员的分工既不清晰,挂接又没有章法,这是否意味着对jD句类的探索还没有达到“蓦然”境界?

概念树数量与基本句类数量的对应性或挂接性是句类理论第一棒应该阐释的一项重要课题,但以往一直处于零敲碎打状态,烦请后来者加以弥补吧。下面仅针对“基本逻辑jl”略加说明。

    这需要首先略说一下句类新表相对于旧表的改动。旧表的基本判断句(jD句类)共7组,其句类代码力图保留相应概念树的印记,但实际上又不可能完全做到,从而陷入了一种“憔悴”的困境。新表放弃了句类代码与概念树挂钩的“妄念”,但“明智地”保留了大体与概念林挂钩的思考[**15]。同时,将基本判断句增加了两个:两块句jD0*J和jD1*J,这两位新成员实质上分别是jD0J和jD1J的“新”品种,“新”在“盲肠”[*17]的切除。这样,句类新表就消除了句类旧表在jD基本句类方面的“憔悴”,至于它是否已达“蓦然”境界,由后来者去检验吧。

要点2-2:在基本句类新表里,不带句类代码数字符号的句类共4个,这很有趣,因为它们恰好与HNC常说的“二生三四”相呼应。下面以略微不同于新表的形式把它们写在下面:

 

表:不带数字代码的句类

        句类代码                              建议汉语命名

    XJ = A+X+B                            蓦然作用句

    OJ = OB+O, O = (P;Y;S)                望尽效应句

    DJ = DA+D+DBC                         蓦然判断句

   jDJ = DB+jD+DC                         望尽判断句

 

4个句类显然被赋予了特殊使命,因而具有特殊贡献,但《论句类》并没有明说,为什么?其中的XJ甚至还没有汉语命名,那么,表中建议的命名是否符合HNC的意向?

谢谢你给出的“表:不带数字代码的句类”。这4个句类确实都负有特殊的使命,并都作出了特殊贡献。对此的详尽阐释都需要一篇专文,要点2-2仅回答前两者,对DJ和jDJ的回答将放到要点2-3和要点2-4里去。下面的论述,很大程度上带有回顾性,有些来于内部文字,故一概不标明出处,其内容将超出本节标题的范围,是对前两节不可或缺的补充。

XJ的设置体现下述两方面的意向:一是直接与概念林“作用0”挂接;二是为混合作用型句类的代码书写提供便利。两意向所凝聚的句类知识可概括成下面的语块构成表示式:

       B(XJ) = XB+YB+YC

此表示式提供了XJ或XOJ最重要的世界知识:其GBK2(宾语)一定具有复杂构成;其中的YB不可省略,但经常被被分离出去,与EK(即X或XO)融合在一起。这一语块分离现象值得予以特殊关注,因为它在现代汉语里比较常见,苗传江博士的《导论》对此有比较精致的分析。如果该书再版,希望作者加上英语的对应考察,因为XJ//XOJ及其句类知识并不是汉语的专利。

下面,将插写一大段关于理论工程的话语。《定理》之后,笔者已近10年不再使用理论工程这个短语了,因为在现代语境里,工程已成为产业的专用“茅台”,其他领域几乎没有资格享用。不过,在历史上,著名词典(字典)或全书的编撰实际上都是浩大的理论工程,是许多学者协同工作,攻坚克难的结晶,如法国启蒙运动时期的《大百科全书》,中国乾隆年间的《四库全书》,当然也有个别例外,如物理学家王竹溪先生编撰的《新部首大字典》。句类和相应句类知识的细化描述在形式上类似于词典,而且基本“词汇”仅68个,“词组”最多4556个,规模似乎并不大。但是,句类“词典”完全不同于传统意义下的语言学词典,其每一“词条”的阐释,“内涵”都很简单,一个句类代码而已。但其“外延”的描述规模则可比拟于英语的(get,put,…)等词汇。这些词语的意义随着语境的变动而变动,不同的语境要搭配不同的词汇以形成相应的复合EK构成(这里,不得不借用一下HNC语言),它们所涉及词法和句法知识,用“说不完,道不尽”来形容不算过分。但英语词典的编撰者对此并不感到疲倦,而是乐此不疲。无论现代信息工具多么高明,它代替不了词典编撰所需要的那种敬业精神和蕴涵于其中的一叶知秋智慧,句类“词典”的编撰更要紧记这一点。

幸运的是,句类“词典”并不存在语言词典面临的“说不完,道不尽”困扰,因为语言词典面对的,是概念无限和语境无限的严酷现实,而句类“词典”所面对的,却是概念基元有限和语境单元有限的朗朗乾坤。所谓句类“词典”的“外延”描述,无非是下列两方面的内容。一是句类空间内部的使节派遣,二是向概念基元空间和语境单元空间派驻各类各级外使。这两件事,虽然并非“说不完,道不尽”,但毕竟需要一定的HNC理论素养。故在《定理》里曾名之《句类知识手册》,手册是需要专家来编撰的。

这样的句类“词典”或《句类知识手册》应该说是一项创举,是HNC理论第一棒的一项重大理论工程,但排不上第一号,而是第二号。第一号理论工程是:对概念基元空间里的每一概念基元施行词语捆绑,首先是代表性语言(例如英语和汉语)的词语捆绑,此项理论工程可名之HNC概念“词典”。句类“词典”和HNC概念“词典”是HNC语言知识处理系统不可或缺的两笔“资本”。没有这两笔“资本”,就绝对不可能形成真正意义下的HNC语言知识处理系统,从而造就新一代的语言知识处理产业。HNC语言知识处理系统的核心技术叫语境分析SGA和记忆转换ABST。没有上述第一号和第二号理论工程的扎实成果,语境分析技术SGA和记忆转换ABST技术就不可能过硬,相应的产品就会变成危楼,即使出现了相应的产业,那也不过是这样的一片高楼群,貌似宏伟,却矗立在沙滩或沼泽地之上。总之,“理论-技术-产品-产业”四棒接力的前两棒全新范式打造,是新一代语言知识处理产业不可或缺的前提条件。对这项前提条件的基础建设,尽管10多年前就开始了,但我们依然要抱着“从零开始”的谦虚态度,因为当年起步的步调太匆忙了,后来,又没有及时吸收HNC理论探索第二阶段的成果,已逐步陷于一种故步自封的落后状态[*18]。

理论第一棒与技术第二棒的接力,传统的范式比较简明。在物理学范畴内,理论第一棒的最终成果无非是一组数学物理方程式的建立、诠释、求解与验证,技术第二棒接力的核心任务是对各种已被验证过的方程和算法加以综合运用,理論第一棒與技術第二棒的接力过程(下文将简称理论技术接力)几乎是静悄悄的,这是绝大多数产业理论技术接力的经典范式。现代多数产业的理论技术接力早已完成,有的经历过不只一个世纪的考验。于是,抓产业可以直接从技术第二棒甚至产品第三棒入手。因此,“立足需求,创造需求,狠抓产品,放眼产业”的思考模式,在现代语境下,几乎是“放之四海而皆准”。但是,语言知识处理领域却是一个明显的例外,人们对此依然缺乏最起码的反思。美国Cyc公司的“壮志未酬”,许多著名机器翻译公司的“兴也勃焉,亡也忽焉”,几乎没有听到尖刀之声的追问,如果是在20世纪上半页,应该不会出现这种情况。而这种“沉默”的赫然出现就是缺乏必要反思的明显证据。这些公司的失败不在于他们没有抓好产品第三棒和产业第四棒的接力,而在于公司创立者完全不懂得理论技术接力(此后将不再使用黑体)。至于谷歌和脸谱等网络公司的辉煌,那是由于他们明智地选择了纯数据处理的技术路线,一条可以避开理论技术接力的捷径。此捷径正在受到所谓大数据时代的鼓舞,但其局限性就不会造成巨大的技术泡沫么?该技术泡沫可以永远屏蔽人类先验理性思维的尖刀之声么?

应该强调指出,语言知识处理学界的理性派历来非常重视理论技术接力。但问题的要害在于:理论第一棒如何描述语言知识和相关的世界知识?在传统的处理方略里,其理论第一棒所依托的理论是西方传统的语言学理论,那个理论体系所接力出来的技术与语言理解毫不相干,因为该理论体系本来就不管语言理解,仅主管语言生成。而语言知识处理面临的各类劲敌和流寇(汉语的分词困扰只是15支流寇里一小股)都与语言理解密切关联,传统语言学理论甚至连“敌军”的部队番号连没有搞清楚,那如何能够克敌制胜?由于对复杂的语言现象束手无策,最近才想起来要向语义学讨救兵,未来可能还会想起来向语用学讨救兵,然而,这些都是典型的急病乱投医。关于这个重大问题,许嘉璐先生是中国的第一批先觉,林杏光先生也是。许先生曾在2000年召集过一次关于语言知识处理的高级学术沙龙,林先生在沙龙上作了一个石破天惊式的发言。近年,许先生多次提到林先生那个发言,深表嘉许。什么样的石破天惊?许先生又如何嘉许?这里不拟明言。但要说一声,这是一个极度不寻常的插曲,完全有可能成为未来语言知识处理领域的一个标志性事件,后来者不可不知。考虑到语言知识处理产业终将摆脱语言数据处理的低级形态或阶段,在未来世界的文明舞台上扮演重要角色[*19],特将该事件隐记于此以备忘。

插写的文字到此结束,原计划放在《论机器翻译》和《微超论》里细说。由于本卷后四编的撰写将推迟到最后,为以防万一,略说于此。

回到XJ句类之特殊使命与贡献的话题。该句类可充当广义作用句的代表,形成句类“词典”的8大样板之一。该样板的重点内容是下列5点:格式知识、GBK1省略知识、GBK1与GBK2要素之间的关联知识、GBK2分离知识、XJ与X0J的分工。

在上列5点知识中,第一点似乎达到了理论第一棒的“蓦然”,并已普及化。但后4点肯定不能这样说,都还大有文章可做。这里应该特别指出,XOJ是领域句类代码的主力军,特别是其中的XYkJ。因此,要敏锐地看到此项理论课题的实践意义。

下面,转向广义初始效应OJ特殊使命与贡献的阐释。

如果问:HNC理论探索中的第一次“蓦然”是什么?是抽象概念与具体概念的划分么?本《全书》并没有对此给出明确的答案。这里有点蹊跷,蹊跷就在于该答案的“一明一暗”特性。明的方面是:HNC理论确实明确无误地将语言概念区分为抽象概念和具体概念两大类,让抽象概念唱主角,具体概念唱配角。在为语言概念基元空间配置的456株概念树中,具体概念仅占据区区28株,占比仅为5%。这个景象与常识大相径庭,在任何词典的视野里,特别是在各种专业词典的视野里,如此占比的HNC概念“词典”简直就是一头“怪兽”。暗的方面是:将抽象概念与具体概念的交织性呈现集中赋予另一个大类,对这一大类仅配置了一个字母符号x,给出了该符号的挂靠约定,仅此而已。既没有正式的命名,也没有独立的文字说明。如此独当一面的概念大类竟然没有自己的“地盘”,这是本《全书》众多埋伏里的第一号。埋伏者,暗也。对x曾使用过物性概念这个术语,但它仅适用于xw,而不适用于xp,其非正式性显而易见。最后,必须交代一声,在句类知识里谈及抽象概念和具体概念时,x一定归类于抽象概念,“赦免”其交织性。这是一项约定,下面就要派上用场。

初始广义效应句OJ,曾被赋予如下的句类知识:PB一定以抽象概念为核心要素;SB一定以具体概念为核心要素,YB两可。这是一项约定,该约定体现了HNC理论探索的一项基本追求:语言理解处理必须以排除一切不合理性为目标,把一切不合理的东西一律打入另类,因为语言通常不允许另类的存在[*20]。这就是说,语言理解处理的本质使命是:确定语句或句群的合理性存在,排除一切另类的存在。在《理论》阶段,给这一使命起了一个名字,叫“自知之明”,它来于汉语的一个现成词语,其意义也基本等同于词典的解释。然而,当时并未强调指出:自知之明就是语言理解的本质特征[*21]。如果用使节的形式来表示,那就是:

语言理解 ≡ 自知之明

以上所说,是HNC探索的基本思路,是综合逻辑意义下的基本思路[*22]。为了实践这一思路,就必须制定各种合理性准则。HNC的探索历程,可以说就是一个将各种合理性准则施行符号化的努力过程,而这一努力过程必须在4个层级(概念基元层级、句类层级、语境单元层级和记忆转换层级)分头进行并相互配合,不能仅限于一个层级。如果仅限于一个层级,那必将陷于泥沼之中,甚至可能万劫不复。这项认识在“望尽”阶段是比较明确的,但在“憔悴”阶段,反而曾一度模糊甚至忘乎所以,对合理性准则的制定与阐释掉以轻心,曾出现过过度仰仗某一层级的泥沼性失误。关于“两一定,一两可”准则的原始论述是掉以轻心的典型事例;关于自知之明的“语义距离”测度说是泥沼性失误的典型事例。下面对此给出一个比较具体的说明。

“两一定,一两可”准则是一个次高层级的合理性准则[**23],仅适用于初始广义效应句OJ。如此重要的内容在原始论述里都没有明确地指出来,技术第二棒接力者怎能顺利接棒?下面试图有所弥补,先用3个例句来说明该准则的接力应用。

例句01:心脏||停止了。(PJ,?)

例句02:Colourless green idea||sleep furiously.(SP401J,?)

            (无色的绿色思想||在狂怒地睡觉。)

例句03:所有的石头||都死了。(SP401J,?)

从词法和句法来说,这3个例句都是合法的,但都不合理。从句类知识来看,它们都是显而易见的异类,前两句尤为明显。心脏不符合PB(PJ)的抽象概念要求,“idea”(思想)不符合SB(SJ)的具体概念要求。但这两例句的情况有很大差异,汉语的“停止”不仅可以激活基本句类PJ,还可以激活混合句类XP0J和S0P0J;而“睡觉”则只能激活混合句类SP401J。对XP0J来说,其GBK1的核心要素不排斥具体概念;对SP401J来说,其GBK1核心要素不仅必须是具体概念,还必须是有生命的具体概念。基于上述句类知识的最后一点,例句03的异类判断,也是一件轻而易举的事。但是,这一切轻而易举的判断都必须建立正确句类认定的基础之上,而句类认定本身并非易事。所以,它被列为语言信息处理的5大劲敌之首,也被命名为3大劲敌的劲敌A。如果说以往没有把这个要点说清楚,现在是不是稍微清楚了一些了呢?借这个机会,下面还要再写一大段“题外”话,这段话在笔者脑际盘旋了10多年,现以文字形式公开,供来者参考。

上面对初始效应句OJ的句类知识描述,只是句类知识描述的冰山一角。这样的句类知识描述是HNC理论第一棒的一项历史性使命,因为句类空间的这些世界知识是HNC技术和HNC产品的命脉。以往,对这项使命的重要性说得不算少,但对其繁重性和紧迫性则说得太少。这就造成了一种误解,以为HNC理论第一棒的命脉性课题不过是传统意义下词语知识库建设的另一种形态。这一误解早已造成了十分严重的后果,上述HNC概念“词典”和句类“词典”的建设已严重滞后,这必然导致HNC技术的智力水平长进得很慢,基本功依然很弱。HNC技术一直忙于提升产品第三棒的外功,顾不上理论第一棒和技术第二棒接力的内功培育。当然,产品第三棒和产业第四棒的外功非常重要,在全球的所有竞争舞台上,都是外功在表演,这是世界潮流,不跟随世界潮流是不行的。但不应该忘记,绝大多数第一流外功的背后都有深厚内功的支撑,有些内功甚至经历过几个世纪的磨练。语言知识处理产品和产业还没有出现第一流的外功,语言数据处理终究不能完全替代语言知识处理。语言知识处理的内功(即理论技术接力)培育拥有充裕的战略机遇期,远远多于10年。所以,笔者对于上述的“顾不上”,并不介意,因为急功近利的现实意义并非词典的解释。尽管如此,还是要清醒地认识到,内功的培育要花大力气,要组织高水平的专业队伍,不能老是耽搁,HNC技术的内功更是如此,因为它几乎没有老本,一切都要从零开始。本《全书》所做的,仅仅是最基础的理论探索与阐释。10多年前,笔者曾向一位创新技术投资企业家说,要搞HNC语言知识处理产业,首先要举办“HNC黄埔军校”,并推荐了一位年轻的校长人选,这一下就把对方吓跑了。

回到上面的3个例句,从语言游戏[*24]的视野来看,三者都属于语句层级的语言游戏,其下有词语和短语层级的语言游戏,其上是句群层级的语言游戏,共4个层级,但传统语言学基本未涉足句群层级的语言游戏。用HNC语言来说,语言游戏的层级表述方式有很大差异,词语大体对应于概念基元;语句大体对应于句类;句群大体对应于语境单元;短语与语块,则连大体对应都谈不上;至于HNC的记忆ABS,就根本没有对应的东西了。HNC的语言游戏以概念基元为基础,以语境单元为中枢。因为语言知识处理必须面对各路劲敌与流寇,如果没有领域句类知识的引导,对于复杂的语句或句群,就难以形成有效的或高效的作战谋略与方案。但是,领域句类的形态与句类完全相同,因此,句类知识与概念基元知识共同构成语言脑的基础世界知识,对这一世界知识的把握与运用是语言脑的固有功能或基本内功。句类新表和混合句类新规则的制定就是为这一基本内功的训练提供更多的便利。顺便说一声,这里的训练当然是针对图灵脑的,但也可能有益于言语脑。

上面叙述了3例句句类知识的运用,在语句所属句类被认定的前提下,3例语言游戏里的“猫腻”都被轻易地解决了。但是,那些句类是如何被认定的呢?前文仅略说了“停止”,言有未尽,没有说到“死”,下面将略加补说。不过,在补说之前,不能不提一下传统语句游戏的根本弊端,那就是脱离语境知识的运用。单一的语句或短语通常不可能提供语境信息,正因为如此,单一的语句游戏可以玩得很精彩,例如“咬死了猎人的狗”。但如果把此类游戏放到句群(即语境单元空间)里去考察,通常就没有多少游戏价值了。

“停止”必须配置3个句类代码,这是句类“词典”的职责。概念“词典”不可能完全代劳。在主体基元概念里,这是过程1和状态5的根本特性,而转移2、效应3和关系4的概念“词典”却可以承担起大部分代劳职责。这意味着对过程1和状态5的激活词语,需要慎重对待。这是一个意义重大的理论第一棒课题,但笔者仅说过一些零星的话语,未作过正式探索,就便备案于此。

3例句里的激活词语十分简明,分别是“停止”、“睡觉”和“死”。对这一组特例的考察,传统语言学与HNC的“(l,v)准则”几乎没有分歧。不过,HNC更关注下列语言现象:三者都是两主块句,都没有辅块,都没有复杂的语块构成。因此,这3个语句游戏似乎在HNC视野没有多少游戏价值,其实不然。因为“停止”和“死”属于过程1,“睡觉”属于状态5。不过,“睡觉”这个词语在英汉两种代表语言里的表现都非常老实,“停止”的汉语表现也比较老实,英语的表现则非常滑头,“死”的表现则恰恰相反。这个情况必须在HNC概念“词典”里得到充分反映。“停止”是概念基元1078^e22的汉语直系捆绑词语,而英语似乎并不存在该概念基元的直系捆绑词语,但旁系捆绑词语为数众多,分别用于不同语境。有趣而重要的是,这些旁系词语都没有冲破概念联想脉络的底线,因此概念使节可以大显身手,派上用场。“死”是概念基元14eb6的汉语直系捆绑词语,同时又是许多其他概念基元的重要旁系捆绑词语,其中特别重要的两个概念基元是j60c37和462。因此可以说汉语的“死”非常滑头,同样有趣而重要的是,其滑头表现并没有冲破概念联想脉络的底线。英语的“die”不同,它仅能充当14eb6的直系捆绑词语,其另外的两个词项都冲破了底线,需另行处置。概念“词典”的工程性就来于上述两类麻烦:一是选派概念使节的麻烦,二是对冲破底线者另行处理的麻烦。

回到“句类如何被认定”的话题。这是一个非常重大的话题,HNC曾以为,这个话题在《理论》里已经讲得很透彻了,现在看来远非如此。《理论》的基本论点是:一个实际语句的句类必须通过句类检验加以认定,不通过者一律打入另类,请求人工协助。句类检验要以句类知识和概念关联性知识为基本依托。这些话原则上没有错,但句类检验如何施行?如果说当时的想法比较天真,那并不过分。那想法可以概括成下面的陈述:句类检验就是语块核心要素之间的概念关联性检验,而概念关联性是完全可以预期的。可预期性的展现方式无非是以下两种:直接方式和间接方式。直接方式是对HNC概念基元符号自身的解读,间接方式是在不同概念基元之间建立概念关联性表示式,间接方式的发展就是后来正式命名的概念关联式或使节。此陈述里的“完全可以预期”和“无非是两种方式”都没有错,甚至其中的“完全”二字也没有错,HNC的第二阶段探索成果不仅没有形成对两者的否定,而是反过来加强了对两者的肯定。那么,问题出在那里?出在以下两个方面:一是对“HNC概念基元符号解读”处理技巧的特殊性过于忽视;二是对庞大使节系统的建设缺乏一个明确的规划。所以,上面的“比较天真”说辞实质上是一种“自我宽恕”,而后者乃是人类的天性之一,在笔者的睡梦里,曾多次出现过“自我宽恕”的辩护情景。这个问题,将在《微超论》里安排一段回应性说明。本段论述,是对“语言理解的本质就是预期及其检验”这一论断的回应,因此,读者不妨再看一遍本节的注释“[**13]”。

下面从语言游戏的视野,对3个例句再作一番比较,并将以3项“如果说:”结束要点2-2的讨论。

沿袭传统语言游戏的习惯,3例句都被当作大句来对待,上面的句类标注和句类分析就是这么做的。但这种做法与实际语言呈现的差距比较大,后两个例句完全是人为的,就撇开不说了。例句01可能是一种实际的语言呈现,不过,它可能是一个小句,而不是大句。如果它果真是一个小句[*25],句类检验的结果当然不受影响,它依然是一个异类。但对该异类的处理方案则应该截然不同,不是直接请求外援,而是先作内部协调。内部协调者,纠错处理也。例句01可能是“心跳停止了”的笔误,也可能是“心脏停止了跳动”的语音省略。

如果说:例句01是一个小句,所属的语境是已知的,例如,属于主体语境单元“治疗a82a”或“灾祸善后a84b”。那么,请你思考一下,上述内部协调或纠错处理的事依然是一种梦幻般的难事么?把此类梦幻般的难事搞出一些样板来就没有显示度么?就会落得个悲惨下场么?就一定不会在主流之外,闯出一条异军突起的新路么?

如果说:句类检验是HNC语言知识处理的必由之路,它不仅是句类分析SCA的必由之路,也是语境分析SGA的必由之路;它不仅是小句分析的必由之路,也是大句分析的必由之路;它不仅是所有主句分析的必由之路,也是所有句蜕分析的必由之路。那么,请思考一下,你认同此段陈述么?

如果说:通过句类分析SCA发现异类,通过语境分析SGA决定异类的处置方案。那么,请思考一下,你如何看待此段陈述呢?

要点2-3:关于块扩判断句DJ的特殊使命与贡献

句类代码不带数字的基本句类都是基本句类世界的“元勋”,不过,对4位“元勋”特殊使命与贡献的认识过程与深度则差异甚大。如果以认识的最高“蓦然”度“1.0”为标准,那么,在HNC探索的第一阶段,四者的“蓦然”度如下表所示:

 

        表:基本句类“元勋”在HNC探索第一阶段的“蓦然”度

 

        句类代码        初始“蓦然”度

          XJ              1.0

          OJ              0.3

          DJ              0.8

         jDJ              0.6

 

此表是一种特殊形式的回顾,不对其中的“蓦然”度作具体说明,但该数字系列可充当本节全部论述的重要参照。至于后3者的当今“蓦然”度,就留给读者去猜度吧。

关于广义对象语块GBK可以扩展为语句的认识,可以说缘起于两个基本句类:一是“元勋”之一的DJ,二是句类新表里的新成员T30J。但后者经历过一番折腾,前者没有。因此可以说,DJ是诞生块扩概念最重要的句类缘起,其特殊贡献即在于此。

这里应就便强调一下,块扩概念不仅缘起于句类,也缘起于对语言进化过程的考察,也就是对语块属性演变过程的考察,那就是前文多次论述过的(B,C,E.A)演变过程。此项考察没有语言“化石”的直接证据,似乎不具备科学考察的资格。但是,是否可能存在着下述情况:语言“化石”隐藏在一些原始语言或原始语言的遗迹里[*26],而我们却视而不见呢?

至于DJ的特殊使命,那是HNC第二阶段探索才正式形成的。其正式陈述是:为XYD提供最直接、最可靠的证据,DBC(DJ)一定属于描述,而不属于叙述。这是一项再明显不过的世界知识,但多数言语脑却不懂得,HNC不希望未来的图灵脑步其后尘。

使命与贡献也需要一个非分别说,DJ尤其需要。HNC对这个问题很折腾过一阵,但迄今没有给出正式结论,留给后来者吧。

要点2-4:关于是否判断句jDJ的特殊使命与贡献

使命与贡献的非分别说特别适用于jDJ,可归纳成下列4点。

1)jDJ是最原始的3主块句,jD是最原始的EK。同时,它又是最简明的基本句类,是一种具有使节形态的句类,这不能不引起下述联想,jDJ很可能是最常用的记忆模板。HNC很愿意把这一联想提升为HNC二级基本假定[**27]之一。

2)任何句类都可以转换成jDJ,句类转换的概念缘起于此。英汉两种代表性语言都存在这一句类转换现象,但转换方式的差异性很大。这是一个与第一点相互呼应的课题,非常有趣,值得深入考察。

3)古汉语的“…者,…也”现象是汉语的“!0jDJ”样式,英语无此句式。

4)英语jDJ的DB与DC的位置可交换现象是英语的“!1jDJJ”样式,汉语无此句式。

回顾性文字到此基本结束,下面补说一下关于词语层级的语言游戏。两例句[*28]如下:

例句04:秋天的北京||是||美丽的季节。

例句05:盐||-在血液循环中||起着重要地位。

如果读者对句类检验的要素原则、英汉两种语言的要素位置原则、“321”原则里的对仗性原则还有一点印象的话,那么,现在就烦请你综合运用一下“要素原则”、“位置原则”和“对仗原则”,去检验一下例句04。你可能敏锐地发觉,只要把“秋天的北京”换成“北京的秋天”,一切就OK了。因此,你可能产生一种错觉,以为上文里的“综合运用”,不过是一种“虚张声势”。因为真正管用的就是一个“对仗原则”。“秋天的北京”与“美丽的季节”太不对仗了,“北京”是具体概念(且不说它是专用具体概念),而“季节”是抽象概念,基本句类jDJ的DB和DC不允许这种不对仗性的存在。这里不得不说,如果你真的这么想,那就大错而特错了。这是一个重大话题,将安排在《微超论》里详说,下面仅预说一下。为此,先把例句04放大成语句层级的语言游戏,那是指例句04的下列变化形态。

例句04a:秋天||是||北京最美丽的季节

例句04b:北京最美丽的季节||是||秋天

例句04c:秋天的北京||是||美丽的。

北京的秋天||是||美丽的。

例句04d:秋天的北京||(真//很//最)美(丽)。

北京的秋天||(真//很//最)美(丽)

上列变换形态都可以通过句类检验。在这里,“对仗原则”无“用武之地”了,但“要素原则”与“位置原则”依然适用。上面把“要素原则”排在第一位,把“位置原则”排在第二位,把“对仗原则”排在第三位,不是偶然的,请看下文。

要素原则和位置原则是一切语言现象的根本原则,要素原则无语种个性,故排在第一位,位置原则有语种个性,故排在第二位。任何语句的句类检验都要应用这两条根本原则,两者无所不在,无处不用。你刚才说:真正管用的就是一个“对仗原则”。这可是典型的睁着眼睛说瞎话,因为对仗原则不过是要素原则与位置原则所辖属的一条特殊原则,三者之间的关系如同祖孙三代艺人的传承。在例句04里,第三代的表演固然精彩,但你不能把第一代和第二代的奠基性贡献给一笔抹杀了。原则具有“一以贯之”特性,西方文明不太重视这一特性。所以,乔姆斯基先生虽然醒悟到,要在语法规则之上抓住更高的语言原则,但实际上,他并没有抓住什么重要的东西[*29],以下所说,他都没有抓住。

位置原则在英汉两种代表性语言里的具体表现十分清晰,这里再次强调一下以下3点。(1)位置原则不仅是语块构成的基本原则,也是短语构成的基本原则。(2)位置原则包括语块的排序原则,这包括主块排序原则和辅块定位原则,前者指广义作用句的格式原则和广义效应句的样式原则,后者特指现代汉语的fK一定位于特征块EK主体部分前方的原则。(3)位置原则还包括大句里的小句排序原则,所谓汉语的“四合院”特色和英语的“高楼大厦”特色即缘起于此。这里要特别强调的是,以上3点具有“一以贯之”的鲜明特性。位置原则的系统阐释需要一部专著,两特色的阐释应成为该专著的重点。这些,只能寄希望于来者。

要素原则的以往阐释比较分散,可能远没有位置原则那么明晰,这里将略加整理,试图理出一个简明的头绪,概括成以下4点,可另称要素原则3要点。

0)要素原则里的要素是指语块构成里的要素成分,要素原则乃是对语块要素之间概念关联性的描述。这不仅指GBK要素与EK要素之间的关联性,也指GBK要素之间的关联性,还包括主块K与辅块fK之间的在特定条件下的某种特定关联性。动词中心论(包括动词价位论)之所以遭到HNC理论的最多闲话,主要缘起于此。这里应顺便指出,EK要素的核心成分可能不是动词,而是名词或体词。无论是英语还是汉语,这种情况都十分常见。因此,这里的语块要素之间的关联性不能等价于动词与名词或体词之间的关联性,也不能等同于主语与谓语或谓语与宾语之间的关联性,前者的含义宽于后者,更深于后者。

1)从语言进化的视野看,最先诞生的语块要素是对象B,随后诞生的语块要素是内容C,这两步,大体对应于道家哲学所说的“一生二”。接下来的第三步是道家哲学所说的“二生三”,那位“老三”被命名为特征要素E,其诞生的意义,就如同大脑进化历程中语言脑的诞生。再往后的第四步是HNC所说的“二生三四”,那位“老四”被命名为作用者A。

(B,C,E,A)被统称为主块4要素。除了主块K的4要素之外,与“二生三”或“二生三四”同步诞生的,还有辅块fK的7要素,它们依次是:方式Ms、工具In、途径Wy、参照Re、条件Cn、原因Pr和结果Rt。

主块4要素和辅块7要素是要素原则的第一要点。

此点所述,是否符合康德先生反复强调的透齐性标准?请有哲学思考兴趣的读者协助考察。在此基础上,不妨与传统语言学的“主谓宾定状补”说作一番对比考量。

2)主块要素是句类的函数,这就是语块原则的第二要点。其基本阐释如下:句类是有限的,基本句类68组,混合句类最多4556组。这是HNC语句理论(即句类理论)的最终结果,正是基于这一结果,语句无限而句类有限的HNC第二假设才变成了HNC第二公理。句类的有限性必然导致主块要素类型的有限性,要素原则第二要点的诀窍即在于此。该要点是“语块要素之间概念关联性描述”的纲,具有“天网恢恢,疏而不漏”的特质。

Fillmore先生和Schank先生关于语句理论的先行工作曾对要素原则第二要点的探索产生过重要启示,但两位先行者都未能摆脱语句类型无限性的困扰。对两位先生的“壮志未酬”,在《理论》里曾表示过深切惋惜,但HNC理论永远不能忘记这两位先行者之未酬壮志的重大启示意义。

3)要素原则第二要点的“天网”毕竟具有“不漏而疏”的特性,技术第二棒的接力很难适应这一特性。那么,能否把“疏而不漏”转变成“密而不漏”么?这正是要素原则第三要点所要回答或解决的问题。

要素原则第三要点的通俗陈述是:它把要素原则第二要点所构成的“天网”加密了100倍以上。加密的诀窍不过是对第二要点加上两个字——领域,把“主块要素是句类的函数”改成“主块要素是领域句类的函数”,后者就是语块原则的第三要点。

语块原则第三要点怎么就能够把“天网”的密度加大100倍以上呢?道理非常简单,因为领域句类向每一个主块要素所提供的先验性世界知识非常明朗和具体。如果把语境单元空间的景象比作朗朗乾坤,那句类空间的景象就好比是雾霾地域。语言理解处理所面临的各类劲敌与和流寇,在朗朗乾坤下都不难给以精确打击,远比雾霾地域的作战容易得多。那么,“100倍”的依据何在?在于语境单元与基本句类的数量比,这个比值在100以上。这个比值不是数字游戏,也不是维特根斯坦意义下的语言游戏,而是事关语言脑核心奥秘的语言理解处理游戏,或名之语言智力游戏。本卷的前三编,就是关于该游戏的基本教材,而本《全书》的前两卷,则是该教材的基础性素材。

HNC的句类分析技术一直在雾霾地域作战,为什么不向朗朗乾坤的战场进军呢?当然,这场语言智力游戏的伟大进军需要从理论技术接力做起,但该课题一直没有正式启动。是时候了,启动吧!下定决心吧!从HNC概念“词典”和句类“词典”做起。

本节到此,本来可以结束了。但意犹未尽,还想漫谈一下例句05。下面,先将该例句拷贝,并沿袭例句04的做法,把原例句从词语游戏转化成小句游戏。

    例句05:盐|-在血液循环中||起着重要地位。

    例句05-0:盐|-在血液循环中||起着重要作用。      (X0YJ+Re)

例句05-1:在血液循环中-|盐||起着重要作用。      (Re+X0YJ)

例句05-2:在血液循环中-|盐||具有重要作用。      (Re+X0YJ)

    例句05-3: 盐||对血液循环||起着重要作用。        (!11X0Y0J)

例句05-4:在血液循环中-|盐的作用||非常重要。    (Re+S04J)

例句05-5:<盐对血液循环的作用>||非常重要。      (S04J,SB=<!11X0Y0J>)

例句05-6:\{盐作用于血液循环}的机制/||非常特别。(S04J,SB=\{X0Y0J}/)

 

首先要说明的是,这是一个不寻常的混合句类,其句类代码是X0YJ。其次要说明的是,此小句配置了一个不寻常的辅块Re。对这两项不寻常性,将给予充分讨论。不过,在此之前,先介绍一下例句群05-m(m=0-6)各自充当的角色,随后给予简要评述。

例句05-0是病句(例句05)的改正形态,将简称原例句,后续的6个例句都是原例句的各种等效形态。例句05-1仅前移了辅块的位置;例句05-2不仅前移了辅块位置,还变换了EK构件的词语;例句05-3还原了原例句的原初句类代码;例句05-4对原例句进行了句类转换;例句05-5和05-6不仅进行了句类转换,还引进了句蜕,前者引进了EK要素句蜕,后者引进了原型包装句蜕。这些游戏表演具有典型性或样板性,将作进一步的说明。

例句05的原意只是玩一下词语游戏,这种游戏不能说没有一点词法意义,但如果不提升到概念基元关联性的层级去考察,其意义毕竟有限。为什么“起着”不能与“地位”搭配,可以与“作用”搭配呢?这样的问题语习性比较强,漫无边际是其基本特征,属于语言生成领域的课题,不属于语言理解领域。HNC不涉足此类漫无边际的问题或课题,仅关注“语言如来佛手掌”,例句05-m(m=0-6)可视为“语言如来佛手掌”的一种描述样板。

例句05-m(m=1-6)示例了语言的句类转换、句式转换、句蜕和块移[**30]现象。这里出现了4个HNC术语,读者对其中的前3个,应该已经比较熟悉了。这些术语既是“语言如来佛手掌”的基本描述工具,也是复杂语言现象的强有力揭具。

就句类转换来说,本例句展示了两种常见的句类转换:一是主块数量减1的句类转换,二是向简明状态句的句类转换。本例句的原初句类代码是X0Y0J,例句05-m(m=0-2)对应于前一种句类转换,例句05-m(m=4-6)对应于后一种句类转换。前一种常见句类转换一定伴随着主辅变换,后一种常见句类转换一定伴随着句蜕或多元逻辑组合。请注意,这里使用了两个“一定”。倘存疑问,请尝试证伪。无论证伪成功与否,都值得写出论文。

这里还不妨略事回顾,简明状态句S04J和是否判断句jDJ一直被HNC当作是句类空间的两位特级贵宾,因为两者是语言或语言脑进化历程中的两座丰碑,前者是跨进两主块句(B,C)的标志,后者是跨进三主块句(B,C,E)的标志。这个认识以前未敢明言,而以“任何语句都可以转换成jDJ和S04J”的论断予以隐晦表达。不过,隐晦中存在重大失误,那就是过度强调了汉语对S04J的偏好,这可能导致英语无S04J的误会[*31]。偏好这个词语仅适用于描述语习概念f所导演的语言现象,不宜滥用,以前没有把握好这个尺度。对这里所描述的无条件句类转换现象就不适用。此转换,可名之语言返祖现象,名之语言活“化石”现象也许更合适一些。

例句05-3展示了汉语最常见的格式自转换现象[**32];例句05-5和例句05-6分别展示了EK要蜕和包装原蜕的现象;例句05-1、05-2和05-4展示了块移现象。

如何看待上列语言现象?如何透过现象去抓住本质?先这么说一声吧,有些术语仅纯粹用于描述现象,有些术语则力图描述本质,当然,兼顾两者的术语居多。但关键在于,一定要分清前两类术语,这里不能不遗憾地说,语法学的术语基本属于前者。

句类代码X0YJ的不寻常性在于以下两点:(1)该句类代码指明,该语句属于两主块广义作用句;(2)其句类代码必须取X0YJ,而不能取XYJ。

前文曾多次强调过一项铁律:广义作用句的主块数量最少3个,最多4个。那么,本例句是否违规呢?铁律是不允许这个情况出现的。那么,对此如何解释?两条出路:一是某主块被省略(劲敌C或劲敌05)了;二是某主块被变换成辅块(流寇05)了。本例句属于后者,其中的“在血液循环中”是GBK2(X0Y0J)的主辅变换,句类代码X0YJ本身就包含着这一项非常有趣的知识,这样说未免太神奇了吧!非也!它就蕴涵在符号X0YJ里,可以通过一位特级内使把这项知识明确无误地表示出来,该内使的表示式如下:

X0YJ =: (!32X0Y0J,GBK2 => Re;Re = Cn)——(X0YJ-01-0)

早在《理论》阶段,这类有趣而神奇的知识就被命名为句类知识。句类知识是句类分析必须具备的预期知识,没有这些预期知识,句类分析就不可能施行句类检验。遗憾的是,无论是笔者的《理论》和《定理》甚至《全书》,还是苗传江博士的《导论》,对句类知识的阐释都不过是冰山一角或沧海一粟。然而,重要的是:该冰山或沧海是可以描述的,这可描述的冰山或沧海,不妨名之HNC冰山或HNC沧海。如果读者能通过例句05-m的阐释,对该冰山或沧海的奇妙性有所认识,则笔者将不胜欣慰。

HNC冰山或HNC沧海是可以描述的”是一个语法意义下的普通小句,也可以说是一个意义非凡的“是”字句。因为本《全书》就是为它服务的。本来已经为该小句安排了一个带“**”的注释,现决定把该注释变成正文,拷贝如下。

本《全书》曾多次使用过“冰山一角”和“沧海一粟”这两个词语,暗含着与“HNC理论工程”相呼应的意图。但这两个词语很容易造成一种消极印象,如同当年的“HNC黄埔军校”那样。本注释希望对这两个词语注入一点积极因素。现实的冰山水下部分不可见,现实的沧海显得广袤无垠,两者的整体面貌似乎不可知,两者的局部面貌也似乎不可描述。但HNC冰山或HNC沧海完全不同,不可见或广袤无垠、不可知、不可描述的困境都已不复存在,其4层级空间(概念基元空间、句类空间、语境单元空间和记忆空间)的整体面貌已一清如洗,每一层级空间自身与相互之间的宏观与介观面貌也已基本一清如洗,其类型区块分明,联想脉络清晰。类型区块与联想脉络的描述手段与工具已十分齐全,各种类型区块的总量有限,各种联想脉络的总量也有限,这是HNC理论24年探索的基本成果。类型区块总量为104量级,联想脉络总量为105量级,这两点,可以看作是HNC理论探索从“望尽”到“蓦然”的基本标志。所以,HNC冰山或HNC沧海的描绘是一项这样的理论工程,其应有的一切前提条件都已准备就绪,可谓万事具备,只欠东风。那东风不过是一项认识与决心。那项认识的要点是:没有这项理论工程的支撑,HNC设想的语言智力就只能是一句空话,HNC曾引以自豪的自知之明宣扬就是一种忽悠;图灵脑就永远是一座海市蜃楼;语言数据就永远是没有生命力的无机数据,而不是有机数据,再大的大数据、再超级的计算能力也改变不了这个语言数据无机性的尴尬局面;语言信息处理就只能永远停留在数据处理的低级阶段,提升不到知识处理的高级阶段。反之,如果认真启动HNC理论工程,那空话就能变成现实;那忽悠就将是一项伟大的创新;那无生命力的无机语言数据就会变成有生命力的语言记忆;那图灵脑就将成为谋士“张良”,充当后工业时代人类的益友。

总之,理论第一棒与技术第二棒的又一次历史性接力在呼唤HNC理论工程的启动,这是对语言脑深层奥秘探索的呼唤,是大脑深层奥秘探索最关键的一步。第一世界的美国和欧盟不可能领悟到这一点,不可能真正理解这一呼唤里所蕴涵的深层四棒接力意义,第三世界的俄罗斯、日本、韩国和印度也同样做不到。本《全书》不过是为响应这一历史性呼唤略尽绵薄之力而已

下面对这一段拷贝文字略加发挥。如果说“现代学术思潮容纳不了理论工程这样的概念”,那也许有点过分。但可以肯定地说,如果仅打着理论工程的旗号,那一定会沦为学术领域的乞丐。这不仅是第二世界中国的主流景象,第一世界也基本如此,第三世界的俄罗斯和日本更加如此。那么,理论工程只有死路一条么?非也!势不可违,而事有可为,“瞒天过海,暗渡陈仓”之计古已有之,关键在自我清醒耳!

要清醒地认识到:语言学的老祖宗遗产太表象,现代先行者为理论第一棒提供的知识基础太薄弱,两者对语言真谛或语言脑奥秘的揭示都贡献甚微。因此,要真正实现具有语言智力的知识处理或图灵脑技术,就必须给理论工程一个十分独立的地位。如果将HNC理论工程降格为数据库意义下的语言知识库建设,那不仅图灵脑技术没有指望,具有自知之明的机器翻译技术也没有指望,笔者只能言尽于此了。

下面回到例句05的漫谈,主要围绕着例句05-m的句类代码标注,都属于细节,以细节05-n(n=1-4)的名义排序,其部分阐释与上面的发挥有所呼应。

细节01:关于“+”的使用

SCJ与fK之间使用的逻辑符号只有“+”,没有“,”。那么,这个世界的语言里,是否存在(fK,SCJ)或(SCJ,fK)的语言呢?笔者不知。“+”的位置只有两种情况:fK之后或SCJ之后,前者汉语占多数,后者英语占多数,“+”意味着两者都包含fK插入现象。这一语言景象非常明显,也比较有趣,多个fK的出现对此没有任何影响。那么,该景象的汉英差异是否与两种文明的思维方式差异有关呢?笔者尚未曾见到这方面的讨论。

细节02:关于“X0YJ是X0Y0J的主块减1变换”论断的补充说明

前文仅提到:主块数量减1的句类变换必然伴随着主辅变换,但并未指出相应辅块的优先类型,这个问题很值得探索。例句05-m的句类代码标注和特级内使(X0YJ-01-0)给出了此项探索的初步结果。值得进一步探索的是,该特级内使可否提升为

(X0OJ-01-0;O = (P,Y,S))

的形态呢?

细节03:为什么对例句05的混合句类代码选取X0YJ而不选取XYJ呢?

这涉及XJ与X0J的基本分工。HNC约定:XJ用于描述以精神或社会作用为主导的作用,X0J用于描述以物质作用为主导的作用。例句05的作用者是盐,属于基本物jw53,因此,X0YJ乃是HNC的必然之选。这里,“盐”(语块AK)与“起作用”(语块EK)对于此选择的贡献旗鼓相当。通过这个例子,读者不妨重温一下前文关于“主块是句类的函数”与“句类是语块的函数”的讨论,并自问一声,是否受到过“动词决定句类”论的潜意识误导?此潜意识危害巨大,因为它会演变成句类检验的隐形杀手。还应该指出的是,潜意识的说法并不确切,它实际上是赫然存在的显意识,“句类是语块的函数”说就是一个强悍的证据,其强悍性来于它拥有一个强大的后盾,那就是显赫的动词中心论或谓语中心论。

细节04:关于S04J的无条件句类转换

“任何句类都可以无条件地转换成jDJ和S04J”,在微小的HNC世界,这个论断早已成为陈词滥调了。例句05-m(m=4-6)为该论断里的后者提供了一项新证据,可能会给读者留下一个比较深刻的印象。但该组例句的用意不仅在于印象,更在于下述假设:S04J很可能是最常用的记忆模板之一。此假设前仅用于jDJ,现在扩展到S04J,这就把jDJ和S04J都推上了记忆空间特级贵宾的地位,可分别名之jDJ记忆模板和S04J记忆模板。这就是说,在自然语言空间里,“S04J的无条件句类转换”表述是不成立的,因为它仅适用于汉语,并不适用于英语。但在记忆空间,情况或许并非如此,两种母语的语言脑对S04J记忆模板将一视同仁。

本节的撰写方式非常特别,多处违反常规。广泛的回顾与深入的预说插入其间,许多重要的论述放在注释里,以“**”予以标记。这些,就是本节的基本特色吧。

 

小结:

    本章的篇幅大大超出了预期,撰写期间的一次沙龙和一次会议诱发了笔者心中原已平静的波澜,对原已封存的一些老问题进行了再思考,其结果主要反映在第3节。这使得该节的内容与原定的标题不太匹配,但这毕竟属于细节,就决定不改动了。

 

注释

[*01] 此前表述见《定理》p35和《全书》残缺版p1002。

[*02] D“外遇”为简明判断句D1J和D2J,编号为:Y15和Y-16;jD“外遇”为标准基本判断句jD*2J,编号为B-18。

[*03] 英语和汉语在jDJ样式方面的大异其趣现象,前文曾给出过爱因斯坦名言(Subtle is the Lord,but madicious he is not)的示例,该名言的样式不过是《圣经》里著名诗句(Great is the Lord)的模仿。其他类型的示例,请读者自行留意。不过,最值得关注的是HNC定义的标示性句式f41\3,它在两代表语言中存在巨大落差。

[**04] 这里用(3+1)代替4,不过是为了突出指明一个语言现象:其中存在一个块扩句类。基本句类新表最终确定的块扩句类为8个,而不是原初确定的7类。原先还提出过某些基本句类可能块扩的错误提法,例如Y3J,那是形而上思维功力不足的典型表现。这里用“**”来标记这条注释,是希望下面的两段题外话能引起读者的注意。

1)“特殊块扩的辨认”这项课题(编号流寇07)的提出即缘起于可能块扩的错误提法,但基本句类新表确定之后,该课题并未取消,不过,“特殊块扩”的含义改变了。“特殊”所指,乃块扩替换句和块扩双向关系句。两者编号分别为X-29和X-30,即广义作用句的最后两位。两者的Ep和Er紧密连接在一起,很容易与特征块EK复合构成的分析(编号流寇10)发生混淆。在对15支流寇进行编号时,由于受到“20项难点”排序的影响,没有把两者排在一起,可惜。

2)自然语言的两位代表——英语和汉语,块扩句的形态呈现出大异而小同的特征,这是一个非常有价值的课题,是一片待开垦处女地。不仅具有一定的理论意义,也具有一定的实践意义,使之成为机器翻译的第一个突破口。HNC完全可以在这里潇洒一把,作出自己的漂亮贡献,可惜始终处于“按兵不动”的状态。

[**05] 这里故意使用了“最壮丽景象”的短语,不是一般意义下的为了“吸引眼球”,而是为了突出HNC理论体系的一项基本构想:图灵脑不仅可以模拟语言脑的神经元组或皮层柱,也可以模拟神经递质。神经递质的模拟者就是概念空间使者CSE。没有这个前提,图灵脑诚然不可实现;如果拥有这个前提,那别开生面的态势就有希望了。概念空间使者CSE是描述强交织性的强大工具,穿梭在概念基元、句类和语境单元空间的内外使者,我们已经提供了众多的示例。所谓领域之间的强交织性就是语境单元之间的强交织性,所谓的描述不过就是那些示例的如法炮制而已。勇敢地去直接面对语言脑奥秘的探索吧!束手无策的尴尬态势正在或即将发生重大变化(此话有隐,暂不明言)。现在,已经不是“冬天已经来了,春天还会远吗?”的时节,而是惊蛰的时节,后来者不可不察。

但必须指出,不同纬度地区的惊蛰景象有很大差异,这里说的惊蛰大约对应于纬度40地区的惊蛰吧。因为,本《全书》不过是语言概念空间的粗线条描述,从理论第一棒向技术第二棒的全面传递,仅有这些理论第一棒的粗线条描述是远远不够的,还需要众多的细线条描述。在概念基元空间、句类空间、语境单元空间和记忆空间,细线条描述都不是一般的缺乏,后面的3层级空间尤为严重。《全书》里的“后来者”这个词语,都可以看作是需要进行细线条描述的标记。但那些标记多半是信手拈来,未对其急所性和大官子性仔细衡量,这是一件非常遗憾的事。今后,在撰写各空间的残缺部分时,或将有所改正。

[**06] 此表仅给出两个示例,实质上是两个示范,可以推广于许多HNC形态的语言陈述,也简称HNC语言陈述,下面给出一些常用的例子:

              HNC语言陈述                         HNC符号

              作用效用链或主体基元概念            (GX,GY)

              广义作用效应链或广义主体基元概念    (GX*,GY*)

作用效应链的作用效应侧面             XY

作用效应链的过程转移侧面             PT

作用效应链的关系状态侧面             RS

作用句或X句类                       SC(X)//SC(XO)

效应句或Y句类                       SC(Y)//SC(YO)

过程句或P句类                       SC(P)//SC(PO)

转移句或T句类                       SC(T)//SC(TO)

关系句或R句类                       SC(R)//SC(RO)

状态句或S句类                       SC(S)//SC(SO)

广义作用句类                         SC(GX)//SC(GX*)

广义效应句类                         SC(GY)//SC(GY*)

[*07] 本短语可能是首次使用。其基本含义是:混合句类的使用频度随着交织度的增加而增加,原以为此论断也具有实践意义,故前文曾为此花费了一些文字。但多年观察表明,其实践意义可能微乎其微。

[*08] 两“外遇”的句类代码分别是D1J和D2J,命名为简明判断句,以两主块和三主块的修饰词加以区分,编号为Y-15和Y-16。英语和汉语对这两个句类的运用方式差异很大,值得关注,是一枚大官子。

[**09] 在语法逻辑概念树“串联l42”的论述(见[240-4.2]节)中,最初引入包装体和包装品的概念,用于描述包装句蜕的基本结构特征。其中的一段重要话语拷贝如下:

“包蜕l42\3”还引入了再延伸概念l42\3*t=a,这个再延伸概念同“串联第一本体呈现l42t=b”一样,纯属彼山景象,没有直系捆绑词语。它纯粹是为“包装品”和“包装体”这两个重要概念而设置的

后来,在关于文明的论述中,也曾多次使用包装体和包装品的概念,但属于借用。借用时往往比较突出两者的主辅之分,包装体为主,包装品为辅,而两者的原定义并不强调这一点。借用意义的变化缘起于对资本与技术联姻的感悟,但本《全书》并未对该感悟明说,仅在一项注释(见本编第一章第1节的注释“[10]”)里比喻了几句。这里的标签相当接近于包装品的借用意义。

[*10] 叙述与描述的HNC符号如下:

      (narrate;叙述;) := 23989

          (describe;描述;) := 2398(~9)

[*11] 三示例短语所对应的双对象判断句D02J有多种陈述形态,这里给出一种比较接近叙述的形态,各一个例句。例句1:知识分子按照其意识形态的阶级属性来说,可称为资产阶级知识分子。例句2:在文化大革命时期,知识分子的社会状态,排在地主、富农、反革命分子、坏分子、右派、叛徒、内奸和走资派之后,故被戏称为臭老九。例句3:不执行毛主席的革命路线,就必然追随刘少奇的反革命资产阶级路线,于是,这样的领导干部就被叫做走资派。

[*12] 纯点说是点说的一种类型,其基本特征是:攻其一点,不及其余。点说作为面体说的分别说,本来是一种正常的陈述。但纯点说的基本特征必然带来片面性,纯点说这应该引起高度警惕。纯点说这个术语也许是第一次使用,带有贬义,但又不宜过贬,故使用了一个纯字。应该指出:纯点说往往具有透齐性二重性表现,既有透彻性的淋漓尽致,又有齐备性的极度欠缺,此二重性是一切高明纯点说的固有属性。

[**13] 李颖博士曾在一次四人沙龙上(加晋耀红教授、池毓焕博士和笔者)介绍说,他在阐释句蜕和块扩这两个概念时,发现前者比较容易为受众所接受,而后者很难。那么,为什么不能将块扩纳入原蜕的范畴呢?李颖博士的提问是对“句类知识ABC”的不寻常挑战,其不寻常性在于对HNC思考方式提出了某种质疑,而不仅在于块扩这个概念本身。下面的长篇文字主要是对HNC思考方式的阐释。李颖博士的具体问题将放在最后略说几句。

书面语的复杂性,归根结底,就是语块构成的复杂性。HNC把语块分成两大类,主块K和辅块fK ,主块又分成广义对象块GBK和特征块EK两大类。K与fK,GBK与EK,都会出现非常复杂的结构(简称语块复杂构成),尤其是广义作用句基本格式里的最后一个GBK(GBK2或GBK3)。如果出现块扩现象,它一定发生在这里,而不会出现在别的地方。

广义对象块GBK的编号3分(GBK1、GBK2和GBK3)形式上似乎是对传统“主宾”说和“双宾语”说的继承,实质上不是,而是在作用效应链与主块4要素(B,C,E,A)之间进行联姻思考的结果。此项联姻思考经历了一个漫长的历程,感受过“望尽”-“憔悴”-“蓦然”的三阶段(三者分别对应于王国维先生所说的三层境界)巨变。三阶段巨变可以有一轮和多轮的呈现。就探索永远没有穷期来说,它一定是多轮的。就HNC的语言脑理论探索来说,它仅完成了一轮,HNC不考虑下一轮的启动,但不断询问自己:真的完成了第一轮的全过程么?下文是对这一自询的简略回答,以三阶段的基本标志为名进行示例性说明。

“望尽”阶段的基本标志是无数的质疑,这里仅举1例,那就是:为什么一个句子可以有双宾语,就不能有双主语和双谓语?双宾语说是否过于稚嫩呢?双宾语的实质不就是对象与内容的基本区分么?在“憔悴”阶段已经明白:双宾语的说法实际上仅适用于4主块转移句和判断句的描述,而不适用于句类空间里的绝大多数成员。

“憔悴”阶段的基本标志是诸多困扰,举4例。1、广义作用句和广义效应句之间赫然存在一个广阔的交织空间,如何处理?2、词语和语句概念化所提供的预期知识(即句类知识),似乎远不足以降伏语言信息处理所面临的各种劲敌和流寇,怎么办?3、语言理解的本质就是预期及其检验(《理论》阶段叫句类检验),那么,检验的基本原则是什么?4、预期检验的本质又是预期能力的检验,那么,影响预期能力的决定性因素又是什么?

前文曾介绍过HNC理论探索历程两阶段的截然划分,两阶段之间停顿过长达9年的时间。上列“憔悴”也可以看作是停顿期的苦楚,主要是后两项困扰引发的苦楚。针对困扰3,当年曾借用过两句古汉语来加以应对,“憔悴”之甚,由此可见。那两句古汉语是:合则留,不合则去,取自苏轼先生的《范增论》。不过,“合则留,不合则去”所表述的逻辑思考不可小觑,往后的许多“蓦然”都受益于它的启发。

“蓦然”阶段的基本标志是若干领悟,也举4例。1、影响预期能力的决定性因素是兄弟俩,哥哥叫领域DOM,弟弟叫动态记忆DM。2、理解处理(包括句类分析和语境分析)和记忆转换处理应遵循侧重点有所不同的处理谋略,前者的处理谋略可概括成“宁细勿粗”,后者的处理谋略可概括成“宁缺勿滥”。(3)“宁细勿粗”谋略最重要的内容是:灵巧运用“三看齐、二对仗、一求证”原则(简称“321”或“三二一”原则),不放过对任何疑点的追查。(4)“宁缺勿滥”谋略最重要的内容是:紧紧抓住主体记忆ABS[n]和背景记忆BAC[n]的框架,慎重填写每一个栏目,不让任何一个带有疑点的内容进入正式记忆。

下面回到李颖博士的具体问题。

HNC把复杂语块构成分为3大类:句蜕、块扩和多元逻辑组合。句蜕和多元逻辑组合现象可出现于任何一个句类的任何一个语块里,但块扩现象只能出现在28种广义作用句的8种里,且其位置一定对应于基本句式排序的最后GBK。如此鲜明的句类知识怎能不倍加珍惜?从理论意义上说,自然语言进化历程本身就是块扩现象的展现,最原始的语言只有语块BK,第一次进化是从BK块扩出CK,第二次进化是从CK块扩出EK,第三次进化是从BK块扩出AK。关于自然语言进化历程的上述思考是“望尽”阶段的产物,但当时没有胆量写进《理论》里。这里特意用思考替代了论断,因为作为论断,必须依赖相应的证据,那是语言考古学的事。这里不妨说一声,为什么本《全书》对古汉语的“者,也”句式情有独钟?就因为它可以看作是自然语言进化的活“化石”,是第一次语言进化的标志性产物。

诚然,语块复杂构成的句蜕、块扩和多元逻辑组合三分说,与8大词类说和6大句子成分说类似,也具有许多理论上不严谨性,虽然程度上远没有后者那么严重。此三分说存在许多深层次的课题,而HNC始终没有来得及给予足够重视,这里试说3点。(1)三者不属于同一层次的东西,句蜕和块扩的概念以语句为参照,多元逻辑组合的概念以语块、短语或语段为参照,三者不能并列,HNC没有把这一点交代清楚。(2)对三者之间的形式相似性景象缺乏最基础的考察,这包括原蜕与块扩的形式相似性,要蜕、包蜕与多元逻辑组合的形式相似性。(3)对三者自身或相互之间的并串交织景象缺乏最必要的考察。形式相似性景象和并串交织景象是语块构成复杂性的集中呈现,这两种语言景象的语种个性很强,两种代表性语言(英语和汉语)的表现尤为突出。总之,语块构成现象的考察需要新视野和新工具,期盼着李、池二博士不畏艰险,走出“憔悴”,般若“蓦然”。

[*14] 贵宾这个词语也许是本《全书》的第一次使用,但笔者很希望把它变成一个HNC描述的专用术语,以往在讲座中多次使用过。在记忆空间里,贵宾的地位将仅次于使者。使者有特使与普通使者之分,贵宾亦然。

[**15] 这句话里的“‘明智地’”和“大体”有其特定含义,直接联系于下列两个句类代码:

jDJ = DB+jD+DC(是否判断句)

           jD2J = (DB,DC)(势态判断句)

前者凌驾于基本逻辑概念林之上,后者则突破了基本逻辑概念林的底线(基本逻辑未设置概念林jl2)。“大体”来于此,带引号的“明智”也来于此。

这两个句类是原有的,仅改动了后者的汉语命名。多数读者对势态判断句jD2J可能比较生疏,对它与势态句S3J的微妙区别就更加生疏了,这里试用几个例句略加浅说。“敌人一天天烂下去,我们一天天好起来”属于势态判断句jD2J,“东风压倒西风”属于势态句的混合句类S3Y02mJ。古汉语里有一个著名的示范,那就是“屡败屡战”和“屡战屡败”,前者属于势态判断句的混合句类jD2YJ,后者则属于势态句的混合句类S3YJ。此混合句类都是两主块句,各自拥有自己的EK,对应的汉语表达分别是“屡败屡战”和“屡战屡败”。上面的示例可能产生两种效应,一种的积极的,觉得句类空间的景象确实由于基本句类新表的诞生而变得更加清晰了;另一种是消极的,觉得句类空间如此复杂的景象连语言学家都难以把握,何况常人的言语脑或未来的图灵脑?

 [*16] 这里特意使用了久违的符号“φ”,目的在于说明:“望尽”-“憔悴”-“蓦然”的演进过程并不是一个通常意义下的那种攀登,不总是越攀越高,也不总是越走离目标越近。实际上是一种“瞻之在前,忽焉在后”的感受。这里使用符号(φy,8y,jly)以展示广义主体基元概念的最高层面貌,但实际使用的是(y,8y,jly)。希望这个例子能够对上述感受有所启发,这两组符号分别是“望尽”阶段和“蓦然”阶段的产物。

[*17] 两块句jD0*J的缘起是:当两相比较的对象与内容先出现于条件辅块Cn时,相互比较判断句jD0J就由3主块句式减缩为两主块句式。这一语言现象属于主辅变换,但该课题的探索始终未能走出“憔悴”阶段。在制定句类新表时,曾试图对该课题施行一下各个击破的谋略,添加jD0*J是措施之一,删除旧表里的所有∑TBn也是。

两块句jD1*J的缘起思考完全雷同于jD0*J,不过jD1*J的参照句类是jD1J,当其DB进入条件辅块Cn时,jD1J就减缩为两主块句式。不过与jD0*J不同,占据第一块位的,不是GBK,而是EK(jD1J)。这就是说,jD0J的DB2和jD1J的DB在出现主辅变换以后,都变成了多余的“盲肠”,jD0*J和jD1*J所传递的句类知识仅仅是:那“盲肠”已被切除。

[*18] 这里的教训非常复杂,也非常深刻,笔者愚笨,无力思考。

[*19] HNC将语言知识处理与语言数据处理严格加以区分,区分的标志是:懂或理解。懂者或追求语言理解者为语言知识处理系统,不懂者或不追求语言理解者为语言数据处理系统。

[*20] 在HNC的前期理论阐释中,特别强调对诗歌和童话的回避,对口语中各种怪异现象的回避。但是,在完成HNC第二阶段理论探索之后,回避问题已隐而不谈了。因为在语境知识的引导下,那些怪异问题不过是多了一类特殊的“敌寇”而已。

[*21] 在想起自知之明这个词语时,也同时想起了“知之为知之,不知为不知,是知也。”的话语,此话语是对理解最合适的描述。“基本等同于词典的解释”里的“基本”二字即来于此。许嘉璐先生曾批评过《理论》的参考文献竟然未引用《论语》,当时笔者深感惶恐,因为引发了一阵数典忘祖的愧疚。

[*22] 思路这个词语的HNC符号是sr10α,词典的解释是:思考问题的线索、脉络。读者不妨对两者进行对比考察。

[**23] “次高层级的合理性准则”这个短语大约是第一次使用,短语里的“次高”需要解释一下。为此,又需要先说明一下HNC意义下的准则,它与词典意义的准则有所不同。HNC把准则或原则定义为一种伦理属性j8,而不是自然属性j7。伦理属性j8拥有7株概念树,因此应该具有7大类准则,合理性准则是其中之一,符号是jr84e71。HNC约定:合理性准则适用于语言脑,但未必适用于大脑的另外5大构成。合理性准则同任何准则一样,都有自己的适用范围,有的准则适用于语言脑的整体表现,有的准则仅适用于语言脑的局部表现,这样,准则就有一级与二级之分。语言脑的一级准则有:语言概念的抽象与具体两分、抽象概念的作用效应链呈现、抽象概念基元的范畴三分、语块要素的四分、句类的广义作用与广义效应两分、语境单元的范畴5分:两类劳动与三类精神生活。这些一级准则或最高准则虽然都没有以准则直接名之,实际上都是语言脑的最高准则。为什么不明说?因为它们不一定都是语言脑的“专利”。语言脑的二级准则或次高准则通常以准则或原则名之,前面多次提到的“三二一”原则或“321”原则就是其中之一。准则或原则主要是先验理性的产物,为区别一级与二级准则,通常对二级准则给予“被赋予”的说明。这里的“两一定,一两可”就属于典型的二级或次高准则,因为它仅适用于广义初始效应句OJ。

[*24] 语言游戏是维特根斯坦先生最先提出的概念,非常深刻。本《全书》曾多次引用。

[*25] 只要不出现标点符号错误,这里的“果真”判断没有任何困难。

[*26] 语言“化石”的术语并非首次出现,也许以前曾名之语言活“化石”。在笔者看来,古汉语的“…者,…也”句式就是汉语的语言“化石”之一,故本《全书》经常使用。

[**27] “二级基本假定”是近年来一直萦绕于脑际的一个短语,这里是首次使用。HNC理论的后续探索需要一系列二级假定,“jDJ很可能是最常用的记忆模板”应该是其中的重要成员之一。HNC理论的一级假定仅仅是4个,简称“4无限与4有限”假定,现已演变成关于语言脑的“四有限”公理。语言脑探索所需要的二级假定数量肯定远大于4,首先,概念基元空间、句类空间、语境单元空间、记忆空间的精细描述都需要一些二级假设;其次,语言脑听觉(语音)与视觉(文字)接口的描述都需要一些二级假设;第三,语言脑记忆模板与动态记忆的精细描述也都需要一些二级假设。这些假设就是语言脑探索的“问路投石”。大脑的解剖结构虽然已经非常明朗,但其功能结构并非朗朗乾坤,语言脑也仍然不是,古老的投石问路方式是落后的东西么?非也!这段话语,就当作是笔者向HNC后继者的赠言吧。

[*28] 例句0m(m=3-5)在《全书》p44里首次被引用,当时未注明这3个例句的首创者,如今上网搜寻未得,就不补上了,仅深致歉意。

[*29] 这个话题前文曾经提起过,见…

[**30] 块移这个词语是第一次使用,是语块位置移动的略称。与块移对应的有句移,是小句位置移动的略称。以前曾分别用名块序调整和句序调整,统称位序调整。术语命名的不易与繁琐,笔者不拘小节的积习,造成了HNC术语的混乱,其为害已不容忽视。成立一个术语小组的时机似乎已经到了,其任务就是编辑并出版一本HNC术语的双语(英语与汉语)词典。

[*31] 英语的S04J句类仅见于英语罕用的迭句之中。从这个意义上说,S04J的独立使用,也许确实就是汉语的专利。

[**32] HNC理论在其发展历程中多次出现过术语混乱的悲剧,格式、格式转换和格式自转换的演出悲剧尤其严重。格式与样式是句式的两种基本类型,分别对应于广义作用句和广义效应句。格式是广义作用句的“专利”,样式是广义效应句的“专利”。格式自转换是格式转换里的一类特指,含义有二:一指基本格式之主动式与被动式之间的相互转换,英语非常严谨,及物和不及物动词的区分即缘起于此。汉语则比较随意。二指汉语的一项基本句式特征:凡复合EK含有EH的语句将优先采用!11格式。这些句类知识对于劲敌B的降伏和英汉两代表语言之间的机器翻译皆有神效,属于理论第一棒与技术第二棒接力排练的急所。总之,语言理解处理的全部劲敌都是急所,前10支流寇也是。急所处理无不需要理论第一棒与技术第二棒的高水平接力,准确率与召回率之类的简单信号处理概念,无力承担此两棒接力水平的描述,应另行设计。

 

 

第三卷 第四编 第三章

 

记忆与对象内容(ABS,BC)

 

引言

本编的前两章,主要是探讨记忆如何生成的问题,是记忆生成的分别说。本章所论,则主要是记忆如何唤起的问题,是记忆唤起的分别说。下章所论,则是记忆生成与记忆唤起的非分别说。

相对说来,本章需要阐述的问题比较简单。然而,这是建立在一项基本定义或约定的基础之上。那定义或约定涉及记忆空间的对象与内容。前文已经说过,记忆空间的对象一定是HNC所定义的具体概念,记忆空间的内容一定是HNC所定义的抽象概念,包括两可概念x。

基于上述,本章的分节问题就比较简单,各节的标题命名如下:

1节 具体概念的记忆唤起(对象记忆)

    第2节 抽象概念的记忆唤起(事件记忆)

3节 记忆索引小议

 

这些标题的含义不言自明。但前两节暗含着如下的假定:具体概念和抽象概念将分别构成语言脑记忆的两大阵营,与前两章所论述的基础性记忆阵营三足鼎立。这当然只是一项假定,但已有条件进行实验测试。在前言里写下这么一段话,无非是奢望引起有关学界的注意而已。

关于记忆的按领域聚居原则已在第一章进行了充分讨论,本章将补充另外两项基本原则,安排在本章的第1节作简明论述。本章的主体论述实质上都是一些推测,所以,本章各节的主体内容将分别以推测km-n(k=1-3,m=1-mmax,n=1-nmax)冠名,“k”与本章的3节对应,“m”的含义在各节说明,“n”不言自明。

 

 

第三卷 第四编 第三章 1

 

具体概念的记忆唤起

(对象记忆)

 

前两章介绍过记忆单元、记忆家族、记忆家庭、记忆模板等概念或术语,第一章还着重论述了HNC关于记忆的一项基本原则:按领域聚居原则。该原则虽然便于记忆的生成,却不便于记忆的唤起,这对于具体概念尤为明显。

按照记忆的领域聚居原则,一个特定人的记忆可能散布在非常广阔的不同领域,例如,作为政治家、军事家、战略家、革命家和诗人的毛泽东先生,其活动领域遍及如下的殊相概念林:政治a1、经济a2、文化a3、军事a4、改革b1、竞争b3和理念d1。显然,记忆的领域聚居方式通常不利于名人记忆的唤起,那么,是否应该追问一声,记忆除了领域聚居方式,是否还有其他的聚居方式?名人记忆是否可能构成记忆另一种聚居方式?即不同于领域聚居原则的另一种记忆方式?该记忆方式是否可能更类似于对亲人、朋友或熟人的记忆?所有这些追问的答案应该是:Yes。这些追问可以归结为这样一个问题:某些特定具体概念或抽象概念的记忆是否应该分别采取对象聚居原则和内容聚居原则加以安置,以便有利于相关记忆的唤起?回答也应该是:Yes。

本章将假定:言语脑的记忆存在3套基本原则或3种记忆方式:一是领域聚居原则或领域记忆方式;二是对象聚居原则或对象记忆方式,三是内容聚居原则或内容记忆方式。与此相对应,言语脑应该存在3类记忆区块,可分别名之领域记忆区块、对象记忆区块和内容记忆区块,本章将分别简称领域记忆或领域区块、对象记忆或对象区块、内容记忆或内容区块,内容记忆将另称事件记忆。

言语脑3类记忆区块之间如何分工与配合?言语脑记忆区块与大脑另外5大功能区块之记忆区块之间又如何分工与配合?这是本章不可回避的两个基本问题,然而又恰恰必须回避,因为当前对两者的探索还缺乏最基本的思考依据,说白了就是:迄今为止,记忆面纱的透明度并不比意识面纱的透明度好多少。因此,本章的探索只能采取猜测或推测的方式,本编的编首语之所以特意写下类似科幻作品的话语,主要缘起于此。本编之所以不分小节,也主要缘起于此。

类似于领域记忆以领域为纲一样,对象记忆应以特定对象的名称(专名或类名)为纲。

领域有两类劳动与三类精神生活的范畴划分,名称有“人p”与“物w”的范畴划分。这就是说,对象记忆应该有“人p”与“物w”的范畴两分。因此,本节的猜测将以“1m-,m=1-2)”编号,“11-”对应于子范畴“人p”,“12-”对应于子范畴“物w”,两者将分别简称特定人记忆与特定物记忆。

下面,先给出关于对象记忆的推测1m-n,随后依次述说关于特定人记忆的推测11-n和关于特定物记忆的推测12-n。

推测1m-1:对象记忆应该存在某种类型的层次网络描述。

领域记忆在范畴之下,有子范畴-概念林-概念树-各级延伸概念的层次网络描述,那么,对象记忆在范畴之下,是否也应该存在某种层次网络描述?答案是:Yes。

那么,如何进行对象记忆的层次网络描述?HNC理论关于自然物和挂靠物的庞大设计就是对此课题的基础性思考。当然,从这些思考到对象记忆的具体描述需要写出相应的系列论文,但这已不是本《全书》的事,而是后来者的事或职责[**01]。

推测1m-2:言语脑的某些对象记忆与图象脑或情感脑的记忆存在强交式关联,对于这里的“某些”,不难列出一个相应的清单,但其理论技术接力的探索是一个全新的课题,需要从零做起。

推测1m-3:言语脑的对象记忆应该以特指对象为主体,但如何处理类指对象?这也是一个全新的课题,需要从零做起。

下面进行特定人记忆的推测。

推测11-1:特定人记忆存在若干个天生的“特区”,但多数特定人记忆乃是从领域记忆区块转移而来。这就是说,特定人记忆存在特区特定人记忆与转移特定人记忆的两分。

推测11-2:特区特定人记忆应该包括3个子范畴:自身记忆、亲人记忆、关系人记忆。

推测11-2a:自身记忆除自身之外,应辖属两个小特区:爱人与情人。

推测11-2b:亲人记忆应包包含3个小特区:上辈亲人、同辈亲人和下辈亲人。

推测11-2c:关系人记忆应包含6个小特区:“同学”、“同事”、“友人”、伙伴*、对手*和仇敌。带引号的3个小特区是词典意义的扩充,“同学”包括老师;“同事”包括上级与下级;“友人”包括自身的施惠者(恩人)和受惠者。伙伴*和对手*则是词典意义的收缩,两具体约定:1、仅以自身为参照;2、仅联系于两类劳动,特别是第二类劳动。仇敌的意义同词典,但不仅要区分仇人与敌人,还要区分自身与非自身的不同参照。

推测11-3:转移特定人记忆应该包括2个子范畴:名人记忆与熟人记忆。

推测11-3a:名人记忆应包含2个小特区:pa00iα=a和gpa00iα=a。泰戈尔先生、毛泽东先生和康德先生分别属于前者的pa00i8、pa00i9和pa00ia;贾宝玉和孙悟空则分别属于后者的gpa00i8和gpa00i9。

推测11-3b:熟人记忆应包含6个小特区:rpq64、rpq70、rpq71、rpq72、rpq73、rpq74,分别对应于6类熟人,其汉语名称分别是:服务劳作熟人、语言行为熟人、交往熟人、娱乐熟人、竞赛熟人和行旅熟人。

推测11-n还可以继续,但大急(大场与急所)内容大体如上。

推测11-3所描述的转移记忆皆以挂靠具体概念表示,但仅仅挂靠到概念林,后续工作尚多,皆拜托后来者。

推测11-2所描述的记忆,都有可能从领域记忆转移而来,除了自身记忆里的自身。这里需要进一步深入考察的课题甚多,一概拜托后来者。不过,还是应该说出下面的沙龙话语,无论语言脑是否存在上述记忆转移现象,未来图灵脑的记忆必须采取上述转移措施,把原来存放在领域记忆的部分内容转移到对象记忆里。此项理论技术接力当然会牵涉到一系列“官子”性质的课题,但皆繁而不难,这是可以肯定的。

下面转向特定物记忆的推测12-n。

推测12-1:特定物记忆存在特区记忆与转移记忆的明确子范畴区分么?回答应该是:No。那么,存在从领域记忆向特定物记忆的转移现象么?回答应该是:Yes。

推测12-2:特定物记忆应区分下列4//6个子范畴:自然物jw与rw、基本挂靠物wj、人造物pw与gw、特定属性物x*[02]。

下面写一段沙龙话语,以助读兴。

如果你对rw感到生疏,那就请联想一下云彩、朝霞、夕阳等古老词语,联想一下驰名全球的的世界三大瀑布与三大海潮,也请联想一下北京的昔日沙尘和当今霾雾。

如果你对gw还不很熟悉,那就请进行下列10项联想:一联想《圣经》与《古兰经》;二联想宪法与国际法;三联想各种条约、契约、规章与合同;四联想各类文件;五联想书籍、刊物与各类现代媒体;六联想《国富论》与《进化论》;七联想《战争与和平》与《红楼梦》、“蒙娜丽莎”与“命运”、“维纳斯”与“自由女神”、舞蹈与芭蕾、戏剧与话剧、电影与电视剧;八联想各种其他技艺与“文物”;九联想美元、欧元及其前辈,十联想现代的各种证券及其前辈。

如果本节到此结束,似乎太急促了,写一段多余的话吧。

上面,给出了特定物rw的3类联想清单和gw的10项联想清单;前面,给出了特定人的联想清单。依据这些清单,不难在概念基元空间找到自己的挂靠基元。通过这些挂靠基元概念及其使节,对象记忆空间就可以形成自己的“独立王国”。那么,言语脑存在这样的独立“王国”么?对此,最好的回答是下面的答非所问:图灵脑必须建立起自己的对象记忆独立王国,并将被赋予使节的任命与派遣权。

 

注释

[**01] 凡本《全书》所说后来者的事或职责,其理论阐释都需要写出相应的论文。此类论文的探索性太强,要符合现代刊物的标准,需要做很多劳而无益的迁就工作,否则很难找到发表处所。因此,应该考虑创办一个自己的网络刊物,时机已到。大数据时代里毕竟出现了一股语义东风,不可盲目跟随,但应巧加利用。

[02] 关于“特定属性物x*”的章节目前尚未撰写,这里仅举例说明其含义,钻石,珠宝是其中的固体类,矿泉水与硫酸是其中液态类,香与臭以及毒气是其中气态类。

 

 

第三卷 第四编 第三章 2

 

                   抽象概念的记忆唤起

                        (事件记忆)

 

    上节讨论了对象聚居原则或对象记忆方式,本节将讨论内容聚居原则或内容记忆方式。

对象记忆是以特定人或特定物为中心的记忆,内容记忆是以特定事件为中心的记忆。所以,内容记忆也可另称事件记忆。

对象记忆里的特定人记忆有特区记忆与转移记忆的基本区分,这是HNC记忆理论的一项基本假定。在特定物记忆的讨论中,回避了这个问题。那么,关于内容记忆的讨论可以继续回避么?回答是:不能。那么,言语脑的内容记忆也存在天生的特区么?回答是:Yes!但应该指出,部分言语脑的特区内容记忆区块可能从未被动用过。

言语脑的内容特区记忆是否对应于弗洛依德先生提出的潜意识呢?请读者思考。这里要说明的是:本节不讨论特区内容记忆或潜意识,只讨论从领域记忆转换而来内容记忆。这里暗含着HNC记忆理论的一项基本约定:HNC内容记忆不涉及特区内容记忆或潜意识。

那么,内容记忆是否也同对象记忆一样,存在两范畴的基本区分么?回答是:Yes。

内容记忆的两范畴是:主体语境记忆与基础语境记忆。这两个名称或术语应该属于最自然不过的水到渠成,这里就不加解释了。两种内容记忆分别缘起于主体事件和基础事件,但事件记忆与事件本身是两个概念,同一个事件,会在不同言语脑里产生各不相同的事件记忆。还应该指出,重大事件或热点事件形成事件记忆的概率当然比较大,但就可能接收到该事件信息的言语脑总和来说,形成事件记忆的占比可能并不大,多数记忆应该存放在领域记忆里,甚至是一项空记忆。事件记忆占比将来可能成为一个受到学界重视的概念,因为点击率、收视率之类流行概念毕竟只服务于商业需求,并不能满足认知学和心理学深入探索的深层需求,而本节定义的事件记忆可能更有益于这一需求的服务。

下面将给出一张特殊的表:主体事件示例。这些事件皆发生于20世纪,附有相关世界栏目,有些事件附加了标记“**”,栏目和标记的意义将在本节最后加以说明。“表”后,给出一组基础事件示例

 

表:主体事件示例

(每一事件给了编号0m,共50项)

 

事件名称                                             相关世界

01第一次世界大战、02第二次世界大战、03冷战;

04第二次工业革命;                                      (第一,第三)世界

05朝鲜战争、06越南战争;                                (“第二”,第一)世界

07第一次十月革命、08第二次十月革命*[*01]09苏联解体;

10抗日战争;                                             (第三,第二)世界

11伊拉克巨变、12阿富汗巨变;                                  

13恐怖浪潮与反恐;                                       (第四,第一)世界

14三十年代大萧条、15罗斯福新政[*02]16“战后西欧新政”[*03]

17奥斯威辛惨剧**

18民族平等运动**19妇女解放与平等运动**20性解放运动**                             

21欧盟诞生;22欧元问世;                                        第一世界

23辛亥革命、24五四运动**25北伐、26十年内战、27大跃进、28文革**

29肃反、30反右;

31波尔布特疯狂*

32朝鲜异梦*[*04]33古巴屹立;

34改革开放;

35中国崛起;                                                     第二世界

36印度独立;48c 民族独立运动

37东亚突起*38俄罗斯重建;39东欧重建;

40苏联大清洗**41古拉格惨剧**42卡廷惨剧**

43日本皇军暴行**                                               第三世界

44 埃及革命[*05]、45伊朗革命[*06];46茉莉花革命;

47a 军事政变[*07];

48b 民族独立运动                                                  第四世界

48a 民族独立运动、49南非巨变;47b军事政变;                      第五世界

50 中等收入陷阱;47c军事政变;                                    第六世界

 

    基础事件示例不胜枚举,仅略举数例。这些例子主要照顾中国读者

黄河花园口1938溃决、1942河南大饥荒、大跃进灾祸[*08]

滇池凶祸*[*09];

非典灾难、汶川地震、2009印度洋海啸、2011日本大地震。

 

    内容记忆的两类示例试图展示下列8项意向,列举如下:

1)主体事件记忆一定由(具体概念+抽象概念)共同组合而成,缺一不可,但该组合的核心一定是抽象概念。但是,抽象概念不一定直接联系于相应事件的语境单元,具体概念可以省略,如编号为23-30的事件都省略了“中国”。这是事件记忆提出的两项特殊挑战与机遇,将在下节作专门讨论。这里不妨先指出一个要点:可省略的具体概念一定属于特指,不可省略的具体概念则一定属于类指,如“表”里的妇女、民族、非典。本意向描述了事件记忆的典型模式,将名之j记忆模式

2)基础事件记忆可采用j记忆模式,还可以采用rw记忆模式。前者见基础事件示例的前两行,后者见第三行。

3)主体事件记忆全部示例都属于“第二类劳动a”这一概念子范畴,而且都属于概念林ay的概念基元,无一例外。而且,绝大多数示例的完整表达并不需要ay之间的概念基元复合,也不需要与其他语言概念子范畴的概念基元复合,这并非有意为之,纯属巧合。此项大出意外的巧合当然会伴随着一种喜出望外,为了让读者也能分享这一“意外之喜”,将另写一大段细节说明[**10]。此“意外之喜”不禁激起了下述畅想,那就是:“第二类劳动a”这一概念子范畴的描述周全性[**11]很可能远好于预期,在这个似乎日新月异的后工业时代,它依然展现出无与伦比的适应能力,可以为语境分析服务很长一段时间。

4)虽然主体事件记忆全部示例都属于“第二类劳动a”,但描述事件的核心概念有相当一部分并非来于“ay”,而是来于“ay”之外,其中归结为“a0”的12项事件尤为典型。这11项事件使用了8个词语:革命、解体、巨变、运动、改革、开放、崛起和重建,其中的“革命和重建”各使用了两次,“巨变”则使用了3次,但它们都不是a0”的直系捆绑词语,而主要来于子范畴“by”这一语言现象应该受到高度重视,因为它似乎足以动摇HNC理论关于语境分析的理论基础,事情果真是如此严重么?这个问题将留给后来者去回答。不过,这里要提醒3个要点:1、12项事件里以“革命”命名的两事件有别于历史学的正式命名,HNC的命名方式显然有助于激活两事件的联想。2、以“巨变”命名的前两个事件已有流行的名称,分别叫“伊拉克战争”和“阿富汗战争”,但这两场战争的战争效应与工业或农业时代的战争有本质区别,故以巨变名之以示区别[*12],这有利于与南非巨变的接轨3、以“重建”命名的两事件还没有正式的流行名称,特别应该指出的是,人们对“俄罗斯重建”的认识还极度缺乏后工业时代的视野。这3个要点显然也是3个巨大的难点,但未来图灵脑的生命力将恰恰缘起于此。

5)事件记忆弱相联于事件本身的真相,对于同一个事件,不同语言脑记忆的总和也不一定就足以反映事件真相。从这个意义上说,某些事件的真实面貌可比拟于康德先生的物自体,其真相很难完全探知,示例里的两次十月革命就属于这样的事件。这意味着真相的追问不可以无条件施行,适度回避对真相的追问是一种智慧,未来的图灵脑应具有这一智力。

6)事件记忆同对象记忆一样,是世界知识的精华,是语境分析不可或缺的知识后盾,是形成动态记忆的基本源泉。

7)事件记忆具有下列5项文明特性:历时性、民族性、专业性、心理性和观念性。前两者缘起于基本概念,专业性缘起于两类劳动,特别是第二类劳动,心理性缘起于第一类精神生活,观念性缘起于第二和第三类精神生活。历时性与民族性是文明时空差异性的记忆呈现;专业性是文明主体差异性的记忆呈现;心理性与观念性是文明基因差异性记忆呈现。

8)主体事件记忆的文明特性最突出,基础事件记忆里的“j事件”次之,非j事件”又次之。

8项意向陈述结束,本节的文字可以到此为止。但最后两项意向的陈述似乎过于偏离“力求普及”的承诺,下面略事弥补。

事件记忆的文明时空差异性呈现在“表”里以多个“相关世界”的方式进行标记,例如“表”里的前4项事件记忆(01第一次世界大战、02第二次世界大战、03冷战和04第二次工业革命)采用了“(第一,第三)世界”的方式,后面的两项(05朝鲜战争、06越南战争)采用了“(第二,第一)世界”的方式。这些标注里有三个细节值得提醒一下,一是用“,”而不用“+”;二是前4项记忆里的第三世界实际上仅特指北片的俄罗斯和东片的日本;三是后两项记忆的第二世界实际暗含苏联,故“第二”加了引号。

事件记忆的文明主体差异性呈现以单一“相关世界”的方式进行标记。事件记忆的文明基因差异性呈现则以“**”进行标记。

“表”里还有另外两个重要细节,一是某些事件的命名,如“朝鲜异梦*”和“滇池凶祸*”;二是某些事件编号另加字母,如“47a军事政变”。这些在“注释[**10]”里都有所交代。

 

 

注释

[*01] 20世纪的共产主义革命浪潮或马列主义浪潮曾席卷全球,其高潮是社会主义阵营的建立。该阵营在建立之初就有两面旗帜或两个样板,本《全书》分别名之第一次和第二次十月革命,两次革命的共相是:在马克思主义的理论旗帜下,粉碎民主革命的一切成果;在暴力革命和无产阶级专政的谋略旗帜下,赋予共产党以绝对权力,赋予党领袖以最高权杖。理论旗帜与谋略旗帜交相辉映,曾赢得巨大的软实力。两次革命的殊相是:第一次十月革命采取城市武装起义的革命路线;第二次十月革命采取先建立农村革命根据地、以农村包围城市的革命路线。这是两种革命样板,前者是列宁的创造,可简称列宁样板或列宁-斯大林样板(列斯样板);后者是毛泽东的创造,可简称毛泽东样板。理论上,列斯样板显然仅适用于第一世界,而毛泽东样板则适用于第一世界之外的另外5个世界。但实际上,列斯样板仅成功于一个俄罗斯,毛泽东样板也仅成功于中国、越南和古巴。两样板如今分别演变为第三世界的俄罗斯模式和第二世界的中国-越南模式,这两种模式都是21世纪的新事物,对这两种社会模式的考察,需要新文明视野的同步探索。本《全书》的第一卷,曾为新文明视野的探索提供了一些素材。

[*02] 罗斯福新政的核心就是政经“两手论”。两手是指:不可见的市场之手和可见的法治之手,市场之手的基本内涵是资本的运作与赢利性需求的开拓,法治之手的基本内涵是基本法制的建立、执行与监督以及非赢利性需求的保障。“两手论”就是中国人熟悉的语言:两手都要抓。说详细一点就是:让两手各司其职,相互协调配合,不可让一手独占鳌头。政经“两手论”本来应该成为一项普通的世界知识,但其简明景象或面貌却由于受到各种极端社会思潮的巨大冲击而变得模糊不清。恢复其真貌者,凯恩斯先生也,罗斯福新政之明智乃缘起于凯恩斯主张之睿智。

[*03] “战后西欧新政”这个短语好比是一只巨大的集装箱,内容非常广泛,所以加了引号。历史的西欧不曾形成过一个实际的统一帝国,国家(包括城邦)之间和教派之间的战争绵延不断,直至二次世界大战结束。历史西欧的这一基本特征密切联系于地理西欧、民族西欧、语言西欧、宗教西欧、文明西欧的多样性与独特性。“战后西欧新政”的呈现是全方位的,第二类劳动的所有领域都有重要贡献。考虑到上述两点,对“战后西欧新政”的评说要特别慎重,即使对其最醒目表现的赞赏也应如此。最醒目表现中的两项是:豪华的社会福利制度和德国人对法西斯蒂历史的彻底反思,两者可以当作示范模板来要求于他人么?这就值得思考。“战后西欧新政”的集大成之作是欧盟与欧元的诞生,这两样东西,其他地域至少在21世纪是不可复制的,这是最普通不过的世界知识,然而有点“邪性”。可是,偏偏不信这个“邪”的人,并非不存在,韩国的前总统金大中和日本的首位民主党首相就基本属于这样的人。

[*04] 朝鲜是当今世界依然信奉列斯毛专利的仅存“硕果”,是第二世界的唯一异类,其独夫胆气,堪称历史之最。带着浓重农业时代语境特征的一统三千里江山之梦,竟然翱翔了半个世纪以上,在插上导弹核武器的现代翅膀之后,更是胆大包天,故以“朝鲜异梦”名之。但对该异梦不可小觑,因为它密切联系于中美之间的角力,对中美双方都具有重大的地缘政治价值。金二代和金三代都深谙其中奥秘,故该“异梦”虽然显得非常危险,但玩火自焚的可能性则微乎其微。

[*05] 埃及革命可另名纳赛尔革命,是阿拉伯世界在二战后的民族独立运动与世俗军人夺权运动相结合的革命样板,当年曾在阿拉伯世界产生过重大影响。

[*06] 伊朗革命可另名霍梅尼革命,是伊斯兰世界什叶派宗教扩张运动的革命样板。具有与朝鲜“异梦”类似的雄心,胆气相同,但同样收效不大。且其玩火自焚的风险远大于朝鲜,因为其地缘政治的态势远不如朝鲜,可指望的“靠山”心有余而力不及。

[*07] 军事政变是人类历史上政权更迭的基本方式之一,但如今可以宣告:它在第一世界已绝迹半个世纪以上,在第二世界不曾出现过,在第三世界广袤而复杂的三大片大地上竟然皆奇迹般消亡,在第四世界也趋于衰落,在第六世界已消失多年,仅在第五世界还没有消停。

上述关于军事政变的全球态势,前述关于两个国家的胆气,在50年前都是不可思议的,因为两者皆史无前例。虽然此态势与该胆气并不能充当划分3个历史时代和6个世界的直接依据或广义作用依据,然而却可以作为后工业时代已经到来和6个世界赫然存在的有力旁证或广义效应依据。

[*08] 大跃进灾祸指1958-1961期间在大陆中国发生的一系列巨大事变,其基本内容可概括成以下三点。一是革命狂热,二是剿灭异类,三是饿殍沉痛。狂热集中表现为:(1)人民公社运动、全民土高炉运动、亩产万斤运动;(2)中国将超英赶美,成为世界第一强国,指日可待;(3)中国将超越老大哥苏联,成为共产主义理想社会的第一位贵宾,不在话下。剿灭的集中表现是,制造了一个以彭德怀元帅为首的反党集团。饿殍沉痛的呈现与原委简明而复杂,还存在着奇特的巨大争议。这里回避有争议的饿殍数字,然而不能不提一下沉痛二字的来由,那就是刘少奇先生当年与最高领袖对话中一句极不寻常的话语:人相食,是要上书的

[*09] 中国崛起方式伴随的环境、资源、社会、文明代价问题十分复杂,这里特意仅选滇池为例。因为,当下的滇池巨变并不只是一个单纯的水污染问题或水质问题,是否应该由此引向对社会发展模式的深层思考呢?最近看了凤凰台吴小莉女士关于云南、昆明和滇池的访谈节目,没有听出对这个问题的任何思考,却听到了关于昆明“八通”的宏伟蓝图。但“八通”必须集中于滇池怀抱里的昆明么?这不禁又生起了一层疑惑,故这里特意造出了“滇池凶祸”短语。笔者未去过云南,原因之一就是宁愿保持“八百里滇池,奔来眼底”长联所激发的自然与人文联想,但愿“滇池凶祸”只是笔者的过虑或臆测。

[***10] 本注释将对“表:主体事件示例”(本注释下文将简记为“表”)所列50项事件进行HNC说明。这里特意使用了“HNC说明”这一短语,以区别于词典的释义。读者对此应该不会感到太生疏,因为前面已通过大量示例凸显了两者的基本区别:“HNC说明”以语境意义的揭示为纲,服务于语境单元核心要素——领域——的激活,直接面向语言理解;词典则以语义解释为纲,奉行词语本位原则,热心于语义“芝麻”,采取置语境“西瓜”于不顾的高明策略。高明的表现是:(1)以举例方式加以应付;(2)把语言理解的重任向上推给语用学,向下推给语形学或语法学。

“表”里的50项事件包含下列关键词:(01)世界大战、(02)冷战、(03)工业革命、(04a)朝鲜战争、(04b)越南战争、(05)十月革命、(06)苏联解体、(07a)伊拉克巨变、(07b)阿富汗巨变、(07c)南非巨变、(08)恐怖浪潮、(09)反恐、(10)大萧条、(11)新政、(12)民族平等运动**、(13a)妇女解放运动**(13b)性解放运动**、(14a)欧盟诞生、(14b)欧元问世、(15)五四运动**、(16a)北伐、(16b)十年内战、(17)大跃进、(18)文革**、(19)肃反、(20)反右、(21)波尔布特疯狂**、(22)朝鲜异梦**、(23)古巴屹立、(24a)改革、(24b)开放、(25)中国崛起、(26)国家独立运动、(27)东亚突起、(28a)俄罗斯重建、(28b)东欧重建、(29)奥斯威辛惨剧**、(30)卡廷惨剧**、(31a)苏联大清洗**、(31b)古拉格惨剧**、(32)皇军暴行**、(33)埃及革命[*05]、(34)伊朗革命[*06];(35)茉莉花革命、(36)军事政变、(37)中等收入陷阱。列举的关键词共计37项,其中的若干项含有分项。

下面就来对这37个关键词进行HNC说明。这个说明比较庞杂,将划分为以下4个方面:方面01:事件记忆的宏观领域挂接;方面02:事件记忆的语境单元挂接;方面03:事件记忆的命名及其符号表示;方面04:事件记忆的特殊标记。就语境分析或未来的图灵脑来说,这4个方面的相关课题,既是挑战,又是机遇。下面的论述,请把它看作是一次练习,一个粗糙的样板。这4个方面之间具有特殊的关联性,下文会给出呼应性论述。最后,还要加一个“方面05:关于记忆的若干思考与细节”。

 

方面01:关于“事件记忆的宏观领域挂接

依据上列关键词所提供的语境信息,“表”里所列50项事件可分别纳入下列宏观领域。

——a0:(03)工业革命、(05)十月革命、(06)苏联解体、(07a)伊拉克巨变、(07b)阿富汗巨变、(07c)南非巨变、(15)五四运动**、(24a)改革、(24b)开放、(25)中国崛起、(28a)俄罗斯重建、(28b)东欧重建(共8//12项)

——a1:(08)恐怖浪潮、(09)反恐、(12)民族平等运动**、(13a)妇女解放与平等运动**(13b)性解放运动**、(14a)欧盟诞生、(18)文革**、(19)肃反、(20)反右、(21)波尔布特疯狂**、(22)朝鲜异梦**、(23)古巴屹立、(26)国家独立运动、(29)奥斯威辛惨剧**、(30)卡廷惨剧**、(31a)苏联大清洗**、(31b)古拉格惨剧**、(32)皇军暴行**、(33)埃及革命[*05]、(34)伊朗革命[*06];(35)茉莉花革命、(36)军事政变(共计19//22项)

——a2:(10)大萧条、(11)新政、(14b)欧元问世、(27)东亚突起、(38)中等收入陷阱(共计5项)。

——a4:(01)世界大战、(04a)朝鲜战争、(04b)越南战争、(16a)北伐、(16b)十年内战(共计3//5项)

上列宏观领域清单仅涉及“专业活动子范畴a”的4片概念林a0a1a2a4。其中,“a1”记忆竟然最多,“a2”与“a4”寥寥,“a3”缺位。这样的记忆清单,对于80后的大陆中国人,几乎是不可思议的。这里将不对此进行评说,而仅略说一下a0”清单,因为与后续的3份清单相比,该清单显得更难理解。

a0”清单里的抽象关键词是:革命、解体、巨变、运动、改革、开放、崛起和重建,它们都不是“a0”的直系捆绑词语,从概念基元来说,这8个词语的对应HNC符号如下:

革命 := b11

解体 := 4123

巨变 := 309a(d01)

运动 := 109

改革 := b10

开放 := b21e25i 

崛起 := 30a9(d01)

重建 := 3518ju78e81

下面就来一一说明上列词语或概念基元的组合游戏规则,这些组合游戏有其唯一的特定服务目标,那就是领域认定。

——“b11(革命)”的组合规则:

0)优先^vo或Bv组合形态;

1)当以^vo形态与ay组合时,纳入相应的领域ay,惟a21β(工业)例外,纳入领域a0*;

2)当以Bv形态与wj1(时间)或wj2(地域)组合时,纳入领域a1,惟“十月革命”例外,纳入领域a0*;

3)当以Bv形态与f32\0e2m(姓名)组合时,按该人的主体专业属性纳入相应的领域ay。

——“4123(解体)”的组合规则:

0)优先ov组合形态;

1)当以ov形态与pj2*d01(帝国)组合时,纳入领域a0*。

——“309a(d01)(巨变)”的组合规则:

0)优先ov组合形态;

1)当以ov形态与pj2*(国家)wj2*-0(地域)组合时,纳入领域a0*。

——“109(运动)”的组合规则:

0)优先ov组合形态;

1)当以ov形态与ay组合时,纳入相应的领域ay

2)当以ov形态与wj1(时间)组合时,纳入领域a13(政治斗争),五四运动的被纳入领域a0*,是特殊例外;

3)当以ov形态与(pφ;φ;pay)直接或间接组合时,纳入领域a13(政治斗争);

——“b10(改革)”的组合规则:

0)优先vo组合形态,汉语反组合居多;

        1)当以vo形态与ay组合时,纳入相应的领域ay

——“b21e25i(开放)”的组合规则:

0)b10(改革)类似,优先vo组合形态,汉语正组合居多;

1)当以vo形态与ay组合时,纳入相应的领域ay

——“30a9(d01)崛起”的组合规则:

0)与309a(d01)(巨变)类似,优先ov组合形态;

1)当以ov形态与pj2*d01(帝国)wj2*-0(地域)组合时,纳入领域a0*;

——“3518ju78e81(重建)”的组合规则:

0)优先vo组合形态;

1)当以vo形态与pj2*组合时,纳入领域a0*;

2)当以vo形态与ay组合时,纳入相应的领域ay。

上面给出了“事件记忆的宏观领域挂接”的一些示例规则,这里应强调指出的,是站在这些规则后面的两个要点。一、以基元概念子范畴(φ,b)为组合的此方;二、以基元概念子范畴aoj为组合的彼方。这两个要点涉及到语言信息处理规则制定的根本困扰,将在方面05里作出重要的呼应性说明。

 

方面02:关于“事件记忆的语境单元挂接”

这里,“语境单元挂接”可以看作是“领域认定”的同义词。方面01所阐释的“宏观领域挂接”实质上就是领域认定的预备动作,也就是认定所属领域的高层,领域高层分两级,一级是领域概念林,二级是领域概念树。在领域高层里,共相领域概念林与概念树属于领域贵宾。这里引入了“高层、一级、贵宾”等醒目词语,确实“别有用心”,将在方面05里有所呼应。

上面指出过,“a0”事件的领域认定都遭遇到重大麻烦,另外3类(a1、a2、a4)事件的领域认定则都比较轻松。对付麻烦需要借助规则,轻松还有这个需要么?这里实际上提出了一个关于“麻烦与轻松”的有趣话题,它十分重要。如果对这样的话题不感兴趣,不深入探索,能够承担起来语言知识处理理论技术接力的重任么?这个问题很不寻常。下面的文字试图引发对这个话题或这个不寻常问题的兴趣,能否如愿,则毫无把握。

也许从关键词谈起是一个不错的做法,方面01也是这么做的。考察一下“方面01”所列举的关键词表,你不难发现,“~a0”里的关键词对领域认定的作用很大,远非“a0”关键词可比。但是,你的这一发现如何变成计算机的发现呢?先说这么一句话吧,HNC已经使这项变成变得易如反掌,看下面的对应表就“一清二楚”了。

请注意,这里特意对一清二楚加上了引号,因为目前还不具备做到这一点的一项基本资源,那就上面反复说到的HNC概念“词典”。遗憾的是,该“词典”目前还不存在,下面,仅利用一下其理论基础的清晰性,考察一下那些“~a0”关键词的HNC对应符号。这些对应符号涉及到许多细节,将随地加以说明。以(说明:…)加以标记。对有些关键词的HNC符号,还给出类似于使节形态的汉语说明。

恐怖浪潮  (rva13e26(d01),l16,(pe,pj01*\4))   反恐  (a13\13,l02,a13e26(d01))

民族平等运动  rva10e259pj52*              妇女解放运动  rva10e25ajw63e22

性解放运动  (rva10e25be26,l10,50a(c2n)3)

(说明:这5个关键词里,有两个没有使用任何逻辑符号,另外3个使用了“ly”。两者的区别在于天赋性的存在与否,前者存在,后者不存在。这里的天赋性相当于康德先生的先验性或验前性,是HNC关于逻辑组合的一项基本约定,不宜深说,就这么打住吧。此外,还有4项细节约定,一是符号“rv”的使用(共计4次),属于语言理解基因第三类氨基酸组合应用的重要形态之一,对应于汉语的“浪潮、运动”等词语;二是自延伸符号(d01)的使用,属于延伸概念内在开放特征的重要形态之一,对应于汉语的“极端、极度、最大、最高”等词语。三是关于恐怖浪潮的“pe”选用,这与“l16,(pe,pj01*\4)的组合密切相关,如果这里选用“p-”或“pe//p-”,那就落入小布什先生的下乘了。四是关于“性解放运动rva10e25be26”符号里的“e26”选用,合法同性婚姻也将作同样处理,必遭谴责,不图辩解,仅致歉意。)

欧盟诞生  (311+EU)

(说明:这是“a1”清单里唯一不带“a1”符号的事件记忆,欧盟诞生是整个西欧历史上的空前事件,虽然目前欧盟面临着种种困难,但这丝毫不影响EU的伟大历史意义。EU属于“a1”,而不属于“a0”,这是实情,也是约定。如同上面的“a0”事件记忆一样,“a1”事件记忆也会直接参与语境分析的领域认定。)

文革  (a13\22e2me26(d01),l15*j2,China;l15*j1,pj12*-00+[1966-1976])

        1966-1976年,极端消极性党派内外政治斗争在中国的呈现)

肃反  (a12\1*te26+a13\12e2n,l15*j2,China;l15*j1,pj12*-00+[1955])

1955年,单一性意识形态治理和正邪性阶级斗争在中国的呈现)

反右  (a12\1*te26+a13\12e2ne2n,l15*j2,China;l15*j1,pj12*-00+[1957])   

        (1957年,单一性意识形态治理与正邪辨证性阶级斗争在中国的呈现)

(说明:这3项“a1”事件记忆采取了同样的记忆形态,给出了同样的标准化汉语说明。这3项事件的汉语说明做到了容纳左右之争的目标,但相应的HNC符号不能也不应该理会这个目标,因而有符号“e26”的使用。这一点,务请读者留意。从语境单元的概念树属性来说,文革仅属于概念树a13,肃反和反右则则同属于概念树a12+a13。三者之间的差异性比较微妙,但相应的HNC符号给出了清晰表示,这一点,也务请读者留意。)

波尔布特疯狂  ((a13\13e2n,Cambodia);l15*j1,pj12*-0+[1970])

1970年代柬埔寨的绝对正邪之争)

朝鲜异梦  ((a133,Korea),l11,a13i9e0n)

(采取农业时代武力夺权方式的朝鲜国家分合之争)

古巴屹立  ((r471,Cuba),l03,a11e1ne22)

            (古巴对非正常政权更迭的适应性呈现)

(说明:这也是3项“a1”事件,但抽象概念与具体概念的组合方式截然不同,这里使用了最简明的串联符号“,”,而未采用上面的“l15*j2”符号。两者的差异在于:是否具有专利性,前者“是”而后者“否”,这是HNC关于逻辑组合的又一项基本约定3项事件记忆的汉语命名与其HNC符号表示之间不存在直接联系,请读者先行玩味,下节会有所呼应。)

国家独立运动  ^(rva15e05t)

奥斯威辛惨剧  (rva12\2e21(d01),l01,Germany Fascist;l02,Jew)

(德国法西斯蒂针对犹太人之对内极端政治应变措施)

卡廷惨剧  (rva12\2e22(d01),l01,Soviet Union;l02,(pa43a,Poland))

(苏联针对波兰战俘之极端政治应变措施)

苏联大清洗  (a12\2e21(d01),l01,Soviet Union;l02,p(j42eb5,a11ie22))

(苏联针对绝对权力政党内部人员的极端政治应变措施)

古拉格惨剧  (rva12\2e21(d01),l01,Soviet Union;l02,p-40\k)

(苏联针对各种关系人员所采取的极端政治应变措施)

(这5项“a1”事件对上述说明里的3项“约定”给出了又一次展示,一是符号“rv”的应用,二是自延伸符号“(d01)”的应用,三是事件记忆的汉语命名与事件HNC符号表示之间的不一致性。顺便说一声,如果把汉语命名中的惨剧改成行动或举措,那只要把相应HNC符号表示里的“rv”取消就对了,对苏联大清洗就是这么做的。下面,将借机写下一段重话和一点感慨。

重话如下:如果现在使用“rv的妙用”和“(d01)的妙用”这两个短语,读者应该不觉得突兀吧,这种感觉很重要,要加强对它的培育。如果没有它,HNC理论第一棒与技术第二棒的成功接力是没有指望的。这一感觉的培育离不开对相关HNC符号及其组合约定的熟练把握,这需要花很大的功夫。

感慨如下:专业活动各概念树的概念结构表示式设计,已是7-6年前的事了。回想当年,常有不堪回首之叹。今天带着一种喜悦的心情,看到了“a12\2e2m内外政治应变”和“a11ie22绝对权力政党”在上述记忆事件中的巧妙描述功效,不禁增添了一份慰藉。)

皇军暴行  ((7331\3e26,p-(a41e5m,Japen));s34,a15e05)

埃及革命  (a11e1ne22\2,l15*wj2,Egypt)

伊朗革命  (a11e1ne22\3,l15*wj2,Iran)

茉莉花革命  (a11e1ne22\3,wj2*-0+Arab)

军事政变  a11e1ne22\2

(说明:本组示例展现了HNC逻辑组合的3种基本类型,请读者自行解读。)

大萧条  ((ra20bbe43(d01),pj01*\1),l15*j1,[20]wj12*-+[20-30]wj12-0)

新政  a25e25

(说明:大萧条和新政竟然都是经济活动a2这片概念林相应延伸概念的直系捆绑词语,应该说,也是一次慰藉。)

欧元问世  (331,s34,a25\1+EU)

(说明:本例又一次展示了逻辑符号“s3y”的约定功效,请回看“欧盟诞生”的说明。)

东亚突起  (a20\0*3+j50e25e25u10ae22,l15*j2,wj2*\1+j21ae902)

(东亚经营财富效应的迅猛繁荣)

中等收入陷阱  (r53e72,s33,a20\0*3(d36))

(经营财富效应中级发展阶段的危机)

(说明:这是关于经济活动a2的最后两个示例,其中的关键概念(不同于关键词!)是“a20\0*3”,对应的汉语名称叫经营财富效应。在其原始论述中有如下话语:经营a20\0面临的第六项课题是经营的财富效应a20\0*3,经营者总是力求扩大企业的财富效应,经营a20\0面临的基本课题当然不只上列六项,但对于交互引擎来说,上列六项所对应的世界知识是最关键的。其中的“不只上列六项”值得一说,在细节方面,它是对“a20\0”概念延伸结构表示式采取封闭形态的两可性提示说明。在内容方面,隐去了a20\0的时代性呈现,符号上可取(a20\0*t=b, a20\0*t := pj1*t)加以明确表示,为什么放弃了呢?因为另有自延伸的备用手段。可约定:a20\0*3对应于工业时代,a20\0*3(c01)对应于农业时代,a20\0*3(d01)对应于后工业时代。以上,是关于“经营财富效应”原始论述的后台思考,对后来者或有参考价值。下面再说两个细节。

一是关于“东亚突起”这个名称,学界或媒体曾经流行的说法是“日本战后崛起+亚洲四小龙”。

二是关于符号“wj2*\1+j21ae902”的使用,意指亚洲的东偏北,除了四小龙里的新加坡之外,其他都符合“东偏北”的标准。空间位置和空间方向的世界知识描述非常繁琐,一般的言语脑都搞不明白。不过,HNC依然搞了一套比较精准的描述方式,未必合用,仅供参考。)

世界大战  a42xwj2*-

朝鲜战争  (a42e2m,Korea)

越南战争  (a42e2m,Vietnam)

北伐  ((a42e21,China),l15*j1,[1926-1927]),l01,Kuomintang;l02,p-*a123(n)e26ju21(t)ae22eb6))

十年内战  (a42e21,China),l15*j1,[1927-1936])

(说明:这是关于军事活动a4的5项事件记忆。命名借沿用了流行词语,在HNC符号的使用方面应指出两点,一是“e2m”和“e21”用在这里非常到位;二是东西南北的HNC符号似乎过于繁琐的问题,这里给出的辩护词是:言语脑可能嫌麻烦,但图灵脑未必。)

细节性说明到此为止,这些事件记忆的领域认定是否易如反掌呢?请读者自行思考。

 

方面03:关于“事件记忆的命名及其符号表示”

在方面02里所列举的事件记忆与其HNC符号表示,绝大多数情况是相互匹配的,但也少数情况并非如此。这个话题不能回避,下面就来说一说。具体涉及下列事件记忆,以“表:事件记忆命名与HNC符号表示的失配示例”的形式给出一个示范性解说。

                   

表:事件记忆命名与HNC符号表示的失配

事件名            失配呈现                       备注

波尔布特疯狂      无“波尔布特”,无“疯狂”      可加疯狂外使

朝鲜异梦          无“异梦”                     可加异梦外使

奥斯威辛惨剧      无“奥斯威辛”                 可加“;pwa13i9t+Osiwicim

(外使:疯狂 =: 7121td01ju806

异梦 =: 7121td01(ju816+ju81e72))

 

备注栏里的pwa13i9t请稍加注意,其对应代表性词语是“concentration camp”或“集中营”,汉语是英语的直接翻译。这个组合词的意义,从其组合元素几乎得不到任何启示,但pwa13i9t却给出了滥刑与奴役这一农业时代的两大邪恶性政治特征,读者不妨将HNC的这一符号表示与词典的释义进行比较。

备注栏使用“可加”,意味着也可以不加。因为疯狂和异梦本身的语境意义在“a13\13e2n”和“a13i9e0n

里已经得到了充分体现。充分体现了么?Yes。这类“Yes//No”问题的深入讨论属于理论技术接力的大急,然而,当代语境的现实是:它大不起来,更急不起来,这也就是写本注释的基本缘起了。

 

方面04:关于“事件记忆的特殊标记”

这里,先套用一个广告词的说法:同一个事件,在一千个人的言语脑里,有一千个不同的事件记忆。同时,还应该加上两个说法,(1)绝大多数事件,在绝大数的言语脑里不会形成事件记忆。(2)许多重大历史事件,只会在相关专家的言语脑里形成事件记忆。考虑到这3点,所谓“图灵脑是言语脑之模拟”的说法是很不严谨的,因为它没有说明是什么样的言语脑。那么,如何界定该说法里的言语脑呢?请允许先使用一下常规的花哨陈述,那就是:图灵脑不是那种一千个人的言语脑,不是对绝大事件不形成事件记忆的言语脑,也不是对重大历史事件形成专家式事件记忆的言语脑。图灵脑是一种特殊的言语脑,是语言超人的言语脑,它自身拥有一套独特的事件记忆规则与方式,本节的正文里已经指出过8个要点(名之意向),其一是图灵脑的事件记忆带有一些特殊标记。至于言语脑是否也存在这一特征,可打入不必过问的事。

表:主体事件示例”里的相关世界栏实质上也是一种特殊标记,这是必须呼应一声的。该表还给出了另外两种标记:“**”和“*”,其一已给出了说明,这里要补充说明的是“*”,它表示该事件已有许多命名,但都不具有尖刀特征。图灵脑希望给出一个符合这一特征的命名,典型示例就是“第二次十月革命*”和“朝鲜异梦*”。这个话,不过是对以往论述的呼应。

总之一句话,言语脑的事件记忆未必带有特殊标记,但图灵脑不可或缺,是图灵脑探索的重要理论课题之一,本节所论,只是一个起步。

 

方面05:关于记忆的若干思考与细节

这里只给出一个略说式或提问式清单。

若干思考的清单如下:(1)自然语言符号体系的某些原始形态特征,例如特定对象所对应的语音符号或文字符号,应该进入语言记忆,它们在语言理解处理全过程中也应该扮演一种不可或缺的角色。因此,HNC理论关于语言概念空间符号体系完全不同于自然语言符号体系的说法显然需要加一条附注:那“完全”不能等同100%。(2)对象记忆与事件记忆的个体差异和群体差异是一个十分有趣的课题,事件记忆的群体差异尤为有趣。当前流行的各种社会调查报告都是事件记忆群体差异性的展现,因此,不妨引入群体记忆与个体记忆的概念以简化描述,两者又皆有对象与事件的区分。(3)人文社会学似乎都只关心群体记忆,社会学这么做乃天经地义,但人文学是否就不能这么说呢?个体记忆的研究、特别是个体事件记忆的研究是否还未引起足够重视?(4)个人的精神特征与智力特征与其个人事件记忆之间应该存在紧密联系,这一紧密联系(一种关联性)又与个人行为的可预期性之间存在紧密联系(另一种关联性),这些联系或关联性的研究是否尚未正式提上日程?

若干细节的清单与上述若干思考的清单将大体一一对应,也是4项。(1)所谓“自然语言符号体系的某些原始形态特征”,归根结底就是一个词语记忆问题,词语记忆必然涉及到母语和外语的问题,也必然涉及拷贝式记忆和理解式记忆的问题。(2)个体的对象记忆与事件记忆的记忆区块是分开安置还是统在一起?(3)HNC意义下的个体记忆仅涉及言语脑,但是,言语脑记忆是一个独立的实存(实际存在之简称)么?这个问题能打入细节么?Yes!因为言语脑记忆的独立存在性是一个不成问题的问题,否则,盲人就不会有记忆了。(4)脑科学的现代研究工具(以功能核磁共振仪为代表)似乎足以承担起个人对象记忆与事件记忆的测量,但尚未见到这方面的实验研究报道。这并不奇怪,因为大脑功能区块显然存在着生理脑、图象脑、情感脑、艺术脑、语言脑和科技脑的基本区分,然而,如此显然的世界知识竟然尚未形成人们的共识。这个情况与三个历史时代和六个世界的遭遇十分类似。

这是本《全书》迄今唯一的一篇三星级(最高级,如同当代所有正常国家的将级军官一样)注释。篇幅之长,出乎意外,原来预定的一些呼应性话语就免了吧。

最后,写几句不可不写的题外话。笔者有一个极坏的习惯,就是对已经写过的东西,愿意闭上眼睛默想一番,可能把部分段落重写一遍,但绝没有通篇重看一遍的耐性。故本《全书》的繁重校对审查工作,一直依赖池毓焕博士。池博士多年来遭受痼疾的折磨,今年尤甚。这篇三星级注释的校对工作,本来不应该再麻烦他了,但又别无选择,因为三星级的文字更需要三星级的审查者。

[**11] 第二类劳动作为一个整体,笔者历来都回避“描述周全性或设计透齐性”的话题,在这里却见诸文字了。这不仅违背了本编预定的撰写宗旨,也违背了波普尔警告,请看作是“即兴之言”吧。

 

 

第三卷 第四编 第三章 3

 

                     记忆索引小议

 

本节标题里的记忆仍然是指狭义记忆,言语脑里存在一个记忆索引的特殊区块么?这也许是一个不曾引起足够注意的问题,本节将给出Yes的答案,并简称记忆索引。

记忆索引的基本特征类似于汉语的现代词典,这是HNC记忆理论的一项基本假定。汉语现代词典一定配置两套索引,一个是按拼音顺序排列的索引,这是所有词典的共相;另一个是按汉字笔画数和偏旁特性排序的索引,这是汉语词典的殊相。两者将分别将名之共相索引与殊相索引,共相索引可以看作是一种自然性存在,而殊相索引则可以看作是一种人为性存在。汉语现代词典为这两种存在性的存在提供了无庸置疑的哲学依据,这份功劳不能不在这里记上一笔。

基于上述基本假定,记忆应具有两套基本索引:共相索引与殊相索引。共相索引对应于第一章所论述的领域记忆,殊相索引则对应于本章所论述对象内容记忆。

对象内容记忆有对象记忆与事件记忆的基本区分,两者是共用一套索引,还是各自拥有一套索引?回答是:都有可能,“公有制”与“私有制”同时存在的可能性最大。对于某些言语脑,“公有制”占主导地位,对另外一些言语脑,“私有制”占主导地位。这里还不妨作出下述假定:专家言语脑的“私有制”比较发达,而常人言语脑的“公有制”比较发达。

汉语现代词典的比喻只是一个对记忆索引的素描,这个素描或许抓住了言语脑记忆的根本特征,但素描毕竟只是素描,记忆索引不太可能只有两套。黄蓉母亲对《九阴真经》的记忆不能看作是金庸武侠小说的神话,它是实际生活的现实。《黄侃传》和《黄焯文集》里都有生动的记载,有兴趣的读者不妨一读。

小议到此结束,有点戛然,曾有申明在先,这就不算犯规了。

 

小结

在第四届HNC与语言学研讨会上,笔者曾宣读过《把文字数据变成文字记忆》的论文,本章实际上是该文的续篇。在探索意义上,本章并没有提出什么新东西。不过,对象记忆与事件记忆的基本区分可以看作是此续篇的新思考,续篇对两者进行了比较深入的分析。但着眼点并不在言语脑本身,而在于未来的图灵脑或语言超人,务请读者留意斯言。

 

 

第三卷 第四编 第四章

 

动态记忆DM与记忆接口(I/O)M浅说

 

引言

这是本全书的第三次浅说,与前两次不同,本浅说放在标题的后方,并不依托于HNC理论体系,或者说它与HNC的联系相当松散,这就是说,本浅说与前两次浅说的前提存在本质差异。

所谓的前提本质差异密切联系于语言信息处理学界当前流行的一种说法,叫混合策略。此混合就是一个“规则+统计”的简单包装品[*01],问题是:言语脑的发育过程,或者说儿童的语言习得过程需要这个简单包装品么?言语脑对语言的理解处理需要运用这个简单包装品么?对这项追问,不能轻易给出Yes//No的简单回答。但前两次浅说对这项追问采取完全不予理会的态度,因为言语脑的理解处理过程不可能使用什么统计工具或统计知识,句类分析与语境分析的理论思路都严格照此办理。但是,图灵脑不应该这么干,人家言语脑并不是单干户,还有另外5位伙伴从旁协助,而HNC设想的图灵脑可是孤家寡人一个,其语境分析怎能不考虑搞点外援呢?那外援,首先就是本章要浅说的动态记忆,它还多少会与统计挂点钩。至于语言接口方面,虽然理论上离“蓦然”境界似乎还差得很远,但毕竟统计技术已经取得了辉煌战果。这意味着本章要浅说的东西将同上述包装品存在某种联系,也就是不再对上面的追问采取完全不予理会的态度。

本章也分3节,目次如下:

1节 动态记忆DM浅说

2节 记忆输入接口IM浅说

3节 记忆输出接口OM浅说

 

 

第三卷 第四编 第四章 1

 

     动态记忆DM浅说

 

引言里已经叙说了HNC引入动态记忆DM这个术语的缘起,但该术语另有源头,这里略作回顾。该术语笔者首见于Schank先生的著作[*02],觉得这个概念是对心理学短时记忆概念的重要补充与发展,对于语言信息处理至关重要,但那只是“望尽”阶段的一种粗浅认识。十多年以后,重新认识了语境的意义,领悟到它在语言脑理解处理过程中的关键性作用,发现了语境单元的有限性。这时,语境单元与句群之间的奇妙联系不再是一幅模糊不清的景象,而是一目了然,一次从“望尽”到“蓦然”的巨变终于完成了。那巨变的标志,可以说就是语境SG与语境单元SGU的符号选取。这里写出这么一句重话,读者应该不会感到突兀吧,但愿如此。那么,下面就要接着写出另一句重话了,那就是:动态记忆DM是语境分析SGA不可或缺的手段或工具之一。

这句重话其实早已是老生常谈了,这里如此郑重其事,不过是又一次对“头版头条”效应有所期盼而已。下面,浅说一番动态记忆DM的要点,以DM0m编号。

 

——DM01:必须抛弃狗熊掰棒子的语句处理方式

此浅说大约到了令人厌恶的程度,所以这里另辟蹊径,从下面的示例说起。它们皆取自前文[*03],其中的示例语句附有HNC标注。

Now is not the time to gut these job-creating investments in science and innovation.

                                              (jDJ),[a25e25,积极经济治理]

现在不是损毁科技革新领域可创造就业方面的投资的时候。

                                                     (同上)

新政  a25e25;

 

这里首先应该发问的是,凭什么把一个句子和一个词语裹在一起当作示例?回答是:就凭那个语境概念基元或语境单元“a25a25积极经济治理”。下面先说两句话,第一句:如果没有动态记忆DM,对于示例里的那句jDJ,很难得到“a25e25”的领域认定。第二句:“新政  a25e25”之所以能够形成正确对应,并不是无条件的,而是密切依赖于“新政”与“罗斯福”和“战后西欧”的组合[*04],而该组合是动态记忆的一种呈现,特别的后者。下面来对这两句话作进一步的说明。

示例里的那句jDJ是一个7大句段落(句群)里的第5句,整个句群并没有出现语境单元所属领域a25e25的直系捆绑词语。但在处理该句群时,依靠动态记忆可以立即形成“a25e25”的领域预期,其中的奥秘,前文已给出了充分论证。不过那论证只揭示了该句群理解处理过程的两项依靠或已知,一靠国情咨文总标题的已知,二靠该句群里若干“a2”词语的已知。其实,该论证实际上打了一个埋伏,它并没有去触及前面句群已经获得的已知。HNC关于动态记忆的再思考就是把这3项已知看作是构造动态记忆的基本资源,此乃旧话重提,这里要特别强调的是:这3项已知非同寻常,将分别名之“知0”(来于标题的已知)、“知-1”(来于前面句群的已知)和“知1”(本句群的已知),三知是言语脑的天赋之一。不同言语脑的这一天赋有高低之分,但不存在有无之分,三知的组合或运用就叫做动态记忆,动态记忆是形成领域预期的可靠保证。言语脑的这一天赋不可模拟么?所谓尖刀之声或尖刀之问,这就是一个,因为它关系到未来图灵脑的命运,读者先思考一下此问的答案吧。

此旧话首次提出的时间并不长,10年前多一点,笔者的表述方式又一直十分笨拙,这包括本编的全部论证。所以,听者不能理解或不予理睬都是正常现象,“狗熊掰棒子”的比喻,就当作是本浅说的第一声呼唤吧。

接着说一下第二句话,此新政不是词典意义的新政,而是a25e25意义下的新政,特指经济活动无形之手(市场之手)与有形之手(政府之手)的积极配合,两手的消极配合就是a25e26。关于资本与技术联姻活动的上述两手比喻是凯恩斯和哈耶克两位先生的联合奉献,这是一项伟大的奉献,是政治经济活动“a25经济与政府”中的一项无比重要的世界知识。因此,HNC理论赋予它一个十分显赫的位置:a25e2n,并将新政划归a25e25的直系捆绑词语。a25e2n必然与概念树“a10m政治体制”发生联系,已通过相应的使节予以表示([130-251])。新政的词典意义是:一般指新制定的政纲、政令,虽然反映了这种联系,却掩盖着两项重大失误,一是混淆了两株重要专业活动概念树(“a10制度与政策”与“a25经济与政府”)的各自独立地位,二是对“新制定的政纲、政令”未必具有积极作用或意义这一点含糊其词。这种混淆与含糊,就是前文反复念叨过的世界知识匮乏症。至于“一般指”三字,则是语义学的惯用马虎眼了。前文有言:由于对复杂的语言现象束手无策,最近才想起来要向语义学讨救兵,未来可能还会想起来向语用学讨救兵,然而,这些都是典型的急病乱投医。斯言可恶,但属于尖刀之声,因为语义学和语用学都没有去直接触及语言脑理解自然语言、语言理解基因与记忆的奥秘。

DM01的标题很不雅观,那就用下面的话语弥补一下吧。狗熊的习惯注定不能改变么?非也,从动态记忆做起就行了。丰富的动态记忆DM是语言脑的秘诀之一[*05],是语言理解处理的关键因素之一,图灵脑的本质是什么?就是试图把狗熊转化成人杰。这转化可能么?进化论者或其怀疑者都会对此嗤之以鼻。但此转化不是自然进化,而是人为的转化,嗤之不等于有理,还是拭目以待吧。

 

——DM02:动态记忆DM是免除坐井观天的火箭

坐井观天是汉语的著名成语,带贬义。但是,坐井观天恰恰是思维和言语脑的常态,词语和句子就是言语脑的井(言语井),语境是语言脑的天(语言天),通过言语井以观察语言天乃思维之必然过程。言语井是无限的,但语言天有限,语言天者,语境单元也。这是HNC第三公理的另一种陈述方式。前面介绍过不少言语井的示例,远的(在第一卷)有康德先生和柳宗元先生的言语井各一,近的有沃克先生和奥巴马先生的言语井各一,这四口井将分别名之康井、柳井、沃井和奥井,它们分别讲的是哪些片语言天呢?请看下表。

 

表:言语井与语言天的对应示例

 

言语井            语言天(HNC符号)      语言天(汉语命名)

康井              a30it=b                 文明基因

柳井              a30\12                  理念文明

沃井              a453b                   精神战备

奥井              a25e25                  积极经济治管

 

如果满足于坐在井底,能看清井上的那片语言天么?这个问题比较复杂,与井的语言形态和天的语境类型密切相关。在上列4井里,康井和柳井都属于古典形态,文字上似乎柳井的障碍更大,其实这只是表面现象,关键在于两者对应的语境天都比较深奥,康井尤然,运用动态记忆的火箭并非易事[*06]。沃井与奥井的情况则有本质区别,动态记忆的火箭不难借用,只要上升到井口,对应的语境天就历历在目。前文就两井所进行的HNC标注,都是那历历在目景象的Smart记录,该记录的Smart特性则隐而未谈。这里,作出相应的交代,这交代里也包含相应火箭的奥秘。

让我们再次回到奥井HNC标注里最Smart的一幕:

Now is not the time to gut these job-creating investments in science and innovation.

                                              (jDJ),[a25e25,积极经济治理]

其中的“Now is not the time”是语言面具,核心内容是“these job-creating investments”,这里的“investments”就是前文所说的“知1”,它单独与“知0”相组合,已足以形成那Smart一幕里的“a25e25”。

“知0”通常是孤独的,但“知-1”与“知1”通常都不孤独。本《全书》尚未提供过“知-1”的示例,那是由于“知-1”与“知1”是一回事,“知-1”是“知1”的既往,“知1”是“知-1”的当今。这个“既往-当今”说当然只是形式视野里的景象,在内容视野里就不能这么说了。动态记忆的核心任务就是将“知1”与“知-1”进行比较,确定两者内容的异同,从而谋划记忆转换的后续处理方式。这几个小句显得很突兀,特别是最后一个小句,下文就来抚平这个突兀性。

“知-1”和“知1”的符号描述方式过于简化了,合适的描述如下:

“知-km”和“知kn” (k//m//n都是有限的自然数)

符号“k”对应于一个HNC句群[*07]或一个语境单元,“m”或“n”则对应于句群里的一个大句。前文对奥井和沃井的描述都只涉及到其中的一组“知kn”,“通常都不孤独”的意思就是:nmax>1在奥井描述里,nmax=7,该段落包含7个大句。这里应该追问下列两个问题,一是前后两个甚至多个段落是否可能描述同一片语言天?二是同一个段落里是否会描述不同的语言天?

HNC对这两项追问的答复如下:如果同一片语言天由相继两个段落加以描述,那也先标记成不同的语言天,即指定不同的“k”值。随后进行语境天的并合处理[**08]。第一个问题比较简单,上面的答复应该可以凑合,但第二个问题则比较复杂。从理论上说,一个段落应该只描述同一片语言天,但这句话本身就存在很大问题。什么叫“同一片语言天”?其中的“应该”如何理解?HNC的每片语言天可不是沙滩上的一粒沙子,而是如同社会里的一位活生生的人。如果说一个社会人的亲人、朋友和关系人可能比较复杂,那就不妨说,语言天的对应情况比社会人更为复杂。如果把一个段落仅仅看作是对一片语言天的特写,那就未免太天真了。然而,这还只是问题的一面,还有更为严重的另一面。同一片语言天的景象,在写者与读者的心中,可能或必然存在巨大差异。写者十分熟悉的“亲朋”和“关系人”,读者可能根本就不认识或不知道,写者信手拈来的东西,读者可能莫名其妙,这是语言理解过程的常态。那么,这是否会造成语言交际的根本障碍呢?答案是清楚而又不是完全清楚的,我们将暂时把这个问题叫做言语脑的特殊奥秘。从维特根斯坦先生开始的语言哲学的宏大语用学转向并没有认真涉及或探讨过这项特殊奥秘。

HNC认为,此特殊奥秘不可回避,有关思考过程大体如下:语境分析通常不难做到对同一段落内出现的不同语境天进行区分,同时又可能对其中的某些大句找不到合适的“婆家”,语境分析的基本对策是,找不到时就老老实实承认找不到,绝不搞强迫“婚姻”。到记忆转换处理时,进行一次舍弃处理[***09],但是,部分被舍弃的东西可能纳入记忆特区备案。

总之,对语境天描述的段间并合处理或段内舍弃处理是记忆转换的一项Smart运作,代表着言语脑的一种天赋功能。此项功能的实践,必须借助动态记忆,因为动态记忆里存有“知0”和“知-km”的知识资源。利用这些资源,言语脑才能够从井底上升到井口去观察更大的语境天景象,取得并合或舍弃的依据,从而决定如何进行这两项处理,即上文所说的记忆转换后续处理。

现在,应该说一下“知0”了。它也可能出现“知0-km”和“知0kn”的情况。这时,“知0”也不是孤独的,需要对“知0”的知识加以综合运用,这属于动态记忆的高级形态。也许可以这么说,孔夫子是深谙高级动态记忆的中华第一人,司马迁继而光大之,而编辑《论语》的孔子贤徒们并不明白这一点。亚里士多德是深谙高级动态记忆的西方第一人,而他的老师柏拉图似乎忽视了这一点。

DM02的论述可以打住了。最后应该说一声,标题不够严肃,火箭的比喻显得过于夸张,目的在于引发读者对于并合与舍弃处理的注意。两者是动态记忆DM的命根子,为此特意安排了两篇二星级注释。但整体阐释还不够透彻,笔者只能力尽于此。这里就便说一句闲话,动态记忆的迄今论述是对编首语里一句话的充分呼应,那句话是:如果说本《全书》对语言学的回避度约为“0.6”,那对心理学记忆的回避度就接近于“1”

 

——DM03:动态记忆DM是剿灭敌寇的利器

言语脑在语言理解过程如何剿灭敌寇的话题已经说过无数次了,本节本可以不再安排这部分内容,由于舍弃处理概念或术语的引入,进入这个话题的念头又一次被引发起来了。下文将从这个话题的最原始论述谈起,原文拷贝如下:

面对语音流的五重模糊(发音模糊、音词转换模糊、词的多义模糊、语义块构成的分合模糊、指代冗缺模糊),面对文字流的后三重模糊,大脑的语言感知应付裕如,表现了强大的解模糊能力,自然语言处理技术当前无从望其项背

句类分析,是对大脑语言感知过程的初步模拟,在上述五重模糊或三种模糊的消解方面,在理论上,句类分析应能接近甚至超过常人的水准。(《理论》pp3-4)

15年前的这段文字今天依然适用么?首先要说的话是:必须作4项实质性改动。一是把“语义块”里的“义”字去掉;二是把“大脑”改成“语言脑”或“言语脑”;三是把“初步”改成“功能”;四是把“句类”都改成“语境”。这4项改动是相互紧密联系的,无所谓孰轻孰重。但《论语境单元》可能造成一种第四项改动最为重要的印象,这种印象并非全错,但毕竟不是“蓦然”境界的东西。所以,下面将借着“利器”与“舍弃”的话题,对15年前的那段文字是否依然适用的问题作进一步的说明。这个说明将围绕着两个短语来漫谈,一是“解模糊”,二是“甚至超过常人”。

自从明确了语言理解处理的敌寇清单之后,“解模糊”就基本不再使用了,因为所谓的“词的多义模糊、语义块构成的分合模糊、指代冗缺模糊”已经分别为被表述为:

劲敌k(k=01-05) 或 劲敌O(O=A//B//C)[*10]

流寇m(m=01-15)

劲敌的降伏或流寇的扫荡并不是通常意义下的选择,而往往是直接的舍弃。在特定语境下,词语意义具有唯一性,语块分合具有清晰性,指代冗缺具有分明性,这样,上述语言模糊景象皆不复存在,何来“模糊”可“解”?因此可以说,所谓语言模糊现象不复存在的“唯一、清晰与分明”说是HNC理论技术接力的核心课题,但本《全书》只管理论第一棒,不管接力。这里有条件写出下面的话语了,那就是:本《全书》连理论第一棒都不可能完全管好,何况接力?概念基元空间的概念树有456株之多,句类空间的基本句类有68组之众,语境空间的语境单元有1-2万之巨,这“之多、之众、之巨”里的每一个都拥有自己的丰富世界知识,要拥有并运用如此庞大的世界知识谈何容易!然而,这正是语言脑的奥秘所在,即:每一个正常的言语脑都具有一种天赋——拥有并运用如此庞大世界知识的天赋,该天赋仅存在高低之分,不存在有无之别。所谓理论第一棒的使命无非就是:对言语脑的天赋功能给出一种形式化[*11]描述,有了形式化描述以后,天赋就能模拟或制造。这是康德先生的信条,HNC不过是追随这一信条而已。本《全书》为言语脑天赋功能的形式化提供了详尽的描述与足够的样板,这些描述与样板,是接力核心课题探索的基础与保障,具有绝对必要性。只有把这个基础与保障搞扎实了,接力核心课题的探索才有可能大踏步前进,货真价实的HNC语言知识处理技术才有可能诞生。这项认识,并非产生于HNC探索的“蓦然”阶段之后,而是在“望尽”与“憔悴”期间,前文提及的“HNC黄埔军校”闹剧就是一项力证。遗憾的是,在那场闹剧之后的一段很长时间,笔者对这个“速利是图”的时局,依然缺乏足够清醒的认识。曾多次妄图使之有所改变,好听的说法叫屡败屡战,实际上就是屡战屡败。

“解模糊”的漫谈到此可以结束了。至于“甚至超过常人”,只需要改动一个字,那就是把“甚至”换成“以至”。未来的图灵脑如果做不到这一点,那就只是一个不及格的成功,或者用前面关于大国崛起的量化说法,叫“0.5”级别以下的成功。

以上所说,似乎是离题万里,实际上都是在呼应“舍弃”说。五重或三重模糊的共相是“多”,“多”意味着一个集合,从集合里选取概率最大的“1”,这就是统计思维的精髓,HNC初期也使用过“多义选一”的说法。但是,言语脑的思维历程不是玄奘的西游,而是拥有现代导航的旅行者,不存在“逢岔必问路”的困扰,那个“多”已转化成“一”,因为言语脑拥有自己的“导航仪”,那就是句类代码、领域和领域句类代码。由于前面已经有了那么多的铺垫,这句话应该不再是一个过于突兀的东西了。

但突兀性毕竟不可能消失,那就再拷贝一次那个具有Smart特性的句子,接着往下漫谈。

Now is not the time to gut these job-creating investments in science and innovation.

(jDJ),[a25e25,积极经济治理]

现在不是损毁科技革新领域可创造就业方面的投资的时候。

此句里的“gut”是一个不寻常的“多”。这里应该追问,当写者把词语“gut”用在这里时,会去思考该词语的其它众多义项么?HNC的回答是:他当时需要一个表述概念基元3428//3528的词语,而其HNC概念“词典”里,“gut”恰好是“3528”的直系捆绑词语之一,于是就被写者偶然地选中了。在这个过程中,会存在一个“gut”的诸多义项闪现于写者脑际的景象么?如果追问仅仅到此为止,那就完全不符合HNC的思维习惯或思考方式,HNC一定会进一步追问,当读者阅读这段文字,碰到这个“gut”时,其诸多义项会闪现于读者的脑际么?这么一个关于“诸多义项闪现于脑际”的存在性问题,答案似乎有点微妙,对于写者和读者可能有所不同。有人说,熟练的写者不需要依靠词典,而不熟练的读者一定要依靠词典,这不就是“可能有所不同”的证据么?追问与提问将到此为止。下文就不再慢条斯理了,来一点蛮横,漫谈允许蛮横。

在本节唯一的三星级注释里,特意提到了两项自动变换及其主要依靠,那里的论述实际上隐藏着一个天然合理的假定,那就是读者必然在追踪写者的思考。假定读者与写者都在使用同一型号的“导航仪”,假定读者与写者言语脑的HNC概念“词典”也大体相同,那么,在遇到那句拷贝话语时,其中“gut”在读者言语脑中引起的反应,应该就是写者当初景象的大体翻版,应该不会引起“gut”的“诸多义项闪现于脑际”,而不过就是预期中的一个“就是她”[*12]。这“就是她”,于写者是一种预期,于读者也是一种预期。那个“她”,就是HNC概念“词典”里“3428//3528”里的一个直系捆绑词语。拷贝文字的汉语译者选择了“损毁”,实际上也可以选择“削减”,后者属于“3428”的直系捆绑词语。这段论述里的两假定、两应该和两预期,以及那个“就是她”,当然都属于典型的蛮横表现。对上一段的全部追问。就以这样蛮横的方式予以回答了。不过,关于“gut”汉语译文的“削减”替换建议,并不蛮横,但是,这又引发出一个问题,那个“3428//3528”是怎么冒出来的呢?对不起,这可要超出动态记忆的话题了。

 

动态记忆DM浅说到此结束,最后漫谈了一把,比较过瘾。不过,笔者期待被记住的仅仅是下面的话语:1、舍弃处理是记忆转换的基本运作,没有舍弃,就没有记忆。2、语境分析SGA、记忆转换ABST和动态记忆DM的三足鼎立局面是语言理解处理框架的基本面貌。遗憾的是,这些话语并未出现于本节的正文,而是放在编号为“[***09]”是注释里。

 

注释

[*01] 此前曾给出过包装品与包装体的各自定义,这里的包装品则是两者(“包装品+包装体”)的组合。

[*02] 那是1989年的事,Schank先生曾写过一本以Dynamic Memory为书名的专著,1992年出版。

[*03] 第一个示例取自奥巴马的2013国情咨文(见本编第一章 1节),第二个是相应的网上汉语译文,第三个取自该节三星级注释“[***10]”里的“方面02”。

[*04] 这里隐藏着如下话语:新政并不能在任何语境下都可以激活a25e25的领域认定,尽管它是a25e25的直系捆绑词语。

[*05] 这意味着短时记忆和长时记忆不是语言脑的秘诀,而只是大脑某些功能区块的一种特征,图象脑和科技脑这一特征或许更为明显,语言脑的这一特征如何表现?疑问尚多。

[*06] 前文曾对康井和柳井给予了特殊描述,有兴趣的读者不妨一阅,它们在“理想行为73219的世界知识”支节([123-2.1-1])

[*07] HNC句群SG的定义是:围绕着同一个语境单元进行语言描述的一组大句,对应于语境空间的符号是SG//SGU,简称句群。最近,许嘉璐先生的博士研究生朱筠在其博士论文里引入了基本句群的术语,其实际含义就是这里所说的HNC句群。HNC句群与语言学所论述的句群存在本质差异,朱筠的博士论文应通过注释的方式明确指出这一点。

[**08] 语言天的数量约在1-2万之间,这是依据语言天的类型和层次区分得出的基本结论,是语言天封闭性呈现的一面。同时,语言天的数量又可以扩展,这是语言天开放性呈现的另一面。开放性导源于语境单元的可组合性和概念树延伸结构的开放性(包括自延伸特性)。封闭性与开放性的兼备,是语言天的基本特征。语言天的类型区分以语境概念树为标准,语言天的层次区分以语境概念树的延伸概念为标准。在语境分析阶段,对每一个语句都必须力求精细,不精细就不能降伏劲敌和扫荡流寇。但记忆转换阶段的处理要求则恰恰相反,不是力求精细,而是追求粗化,要善于抓住要点,抛弃细节。在这个基础上,对相邻段落的语言天(语境单元)进行并合处理。

[***09] 舍弃处理是记忆转换的基本运作,没有舍弃,就没有记忆。这里的舍弃包含以下4层含义,1、对一个段落来说,通常只容许选取一个语境单元(一片语言天)进入相应的记忆单元,其他的语境单元则一概舍弃之,这属于粗化处理的极致形态。2、某些没有搞清楚其语境身份的大句,也照此办理,即不进行记忆转换,这是记忆转换处理的头等大事。3、主要依靠已知语境单元提供的世界知识,把词语义项的“多”自动变换成“一”。4、主要依靠已知句类提供的世界知识把语块组合结构的“多”自动变换成“一”。舍弃处理不仅是记忆转换的常规操作,也是语言输入接口的常规操作。上列4点都显得极为粗暴,两项自动变换似乎更是蛮不讲理,然而这正是记忆的根本特性——粗暴性。我们必须尊重记忆的粗暴性,对记忆粗暴性的尊重就是对读者权利的尊重。读者对写者写出来的东西,总是会粗暴地舍弃一些。“粗暴的舍弃”乃是读者的天赋权利,这是一个十分神秘的课题,这里只能浅说。但可以肯定的是,它必然密切联系于动态记忆,因为如果没有动态记忆,那上述的两项主要依靠就一定会落空,从而那两项自动变换也一定会跟着落空。所以,HNC将把施行舍弃处理的任务交给动态记忆去办理,言语脑很可能也是如此。近年来,一有合适的场合,动态记忆DM这个词语就会挂上笔者的嘴边,这里总算是交了一个底。最后应该指出,言语脑记忆转换舍弃处理的神秘性对于未来的图灵脑并不存在,如果它只对付文字文本的话。这句话会造成读者的困惑么?如果没有,那就表明图灵脑有希望了。

本注释被赋予三星级的待遇,因为就其内容的重要性来说,完全有资格进入本编的编首语,至少要进入本章的引言,但基于前文多次提到的“胆怯”与“照顾”因素,决定后移。但结果变成了一项注释,这并非预定安排,只好采取提升注释级别的下策了。

语境分析SGA与记忆转换ABST这两大语言理解处理环节不是截然分开的,必须相互配合,动态记忆DM就是两者相互配合的中介,中介作用的集中体现就是上述的两项主要依靠与两项自动变换。在某种意义上可以说,三者的三足鼎立才是语言理解处理框架的基本面貌。

[*10] “词的多义模糊”主要对应于劲敌A;“语义块构成的分合模糊”主要对应于劲敌B;“指代冗缺模糊”对应于劲敌C。

[*11] 这里的形式是康德意义下的形式,即

[*12] “就是她”是套用电影《红色娘子军》导演的一句话,他当年为物色片中女主角的演员跑遍各地,后来偶然在火车上遇见了祝希娟,一眼看中,冒出了“就是她”。这句话很传神,故用以描述言语脑理解处理中两项“多”变“一”变换(皆名之自动变换)的基本特征。

 

 

第三卷 第四编 第四章 2

 

记忆输入接口IM浅说

 

这里,对记忆输入接口使用的HNC符号是IM,而不是IABS,这并不意味着本节所说的记忆就是广义记忆,而只是试图表明,在记忆接口方面,狭义记忆与广义记忆的区分就不像记忆本身那么重要了,因为记忆接口与生理脑的联系更为密切。

古汉语概括的眼耳鼻舌身都是信息输入接口的部件,但本节要浅说的记忆输入接口仅涉及眼与耳。就文字文本来说,其IM主要关乎眼;就语音文本来说,其IM主要关乎耳。眼与耳作为信息输入的两个主体接口部件,现代科技对两者的研究已经取得了十分辉煌的成就,浅说意味着还存在一些有待探讨的重要课题,那么,本节可以拿出什么东西来浅说呢?

像上节一样,那东西无非是一些追问。本节仅浅说两项追问。

追问01:语言的声音或文字载体(将统称语言原始信息)在IM里以什么形态存在?是原初形态还是经过某种变换以后的另一种形态?

追问02:语言原始信息的待命形态如何激活语言理解处理系统的概念符号体系?

追问01很可能已经被探讨过,笔者并不了解情况,也没有了解的意愿,下文将以一位探访者的身份说话。追问02的问题比较复杂,“如何激活”是一个多层次的问题,这里只涉及第一层,即概念基元符号体系这一层。该体系是HNC第一个提出来的,并给出了详尽描述,但不能由此就说,追问02还不曾被探讨过。因为从词语到概念的转换是认知心理学[*01]的基础,出现过心理词典的概念及相关论述。

仿照上节的论述方式,下文将以IM01和IM02编号。

 

——IM01:语言原始信息以变换形态流水般暂存于IM。

此标题里有3个关键词:语言原始信息、变换形态、流水般暂存于。下面依次进行浅说,并继续采取以追问为主的浅说形式。

语言原始信息的基本情况众所周知,有两种原初形态的信息流,一个叫语音流,另一个叫文字流。两流的深说都是专门的大学问,HNC不敢问津。本浅说首先要强调指出,两流的终极归宿是个什么东西?这是需要追问的。如果仿效黑格尔先生关于“哲学的开端就是一个假设”的说法,那么就可以说“HNC的开端就是一个追问”,即“语音流和文字流的终极归宿是个什么东西”的追问。HNC把这个东西叫做一片概念海洋,并把那海洋正式命名为语言概念空间,本浅说将给它一个符号SLC。陪伴这个符号的还有SIC(图象image概念空间)、SEC(情感emotion概念空间)、SAC(艺术art概念空间)和SSTC(科技science-technique概念空间)。这组符号曾打算在本卷的卷首语里亮相,撰写时觉得不妥,就安排在这里了。这5个符号分别与语言脑、图象脑、情感脑、艺术脑和科技脑相对应,但请注意,这里并没有给生理脑一个对应的符号SPC(生理physiology概念空间),为什么?因为生理脑是上列5脑的基础设施,它自身就没有独立构造一个上层建筑(即概念空间)的必要性了。

无论是拼音语言还是有别于拼音语言的其他类型语言,都存在语音流和文字流两种原初形态,世界语试图将两种原初形态合而为一,汉语曾试图向拼音语言看齐。两试图皆其志可嘉,但其智不嘉。这项历史教训其实非常有趣,“其智不嘉”的根本原因就在于没有进行上述追问,也就不明白“海纳百川”的中华智慧,从而对语言概念空间运作与语言流原初形态之间的关系,作出了许多“其智不嘉”的想象,并采取了相应行动。这段浅说前文曾多次涉及,这里是最后一次的呼应了。

语言流的原初形态会拷贝于IM之中么?这是第二项追问。回答不能是简单的No,因为有下章要杂谈的拷贝记忆在那里摆着。但在一般情况下,IM不应该是语言流原初形态的拷贝,必然有所变换与舍弃[*02]。变换对语音流和文字流都需要,舍弃则主要是语音流的事。

语音流和文字流的变换是两套东西,这就是说,两者各有一套IM接口,文盲就不拥有文字流IM接口。但语音流IM接口是正常人的天赋,是上帝赐予人类的宝贝,没有这个宝贝,胎教就是瞎掰了。该宝贝的奥秘就在于要施行一种变换,把自然语言符号变换成言语脑的对应符号。这个语言密码本一直锁在上帝的保险柜里,是否曾有人试图打开这个保险柜拿出那个密码本?笔者不知,但语音流IM的浅说并不能因此戛然而止。因为语言学对语音流本身的研究已达到很高水平,声母与韵母的面貌非常清晰,因此,那个语言密码本在语言这一头的代码是相当清楚的,那就是音节及其组合,但对该密码本在概念那一头的对应代码,则一无所知,因此语言理解处理一直处于朦胧状态。HNC的思路是,不去打开上帝的那只保险柜,而是去制造一个功能相仿的语言密码本,用以完成不可思议的语言解码,即语言理解。

记忆输入接口IM只是那语言密码本的绪论,该绪论分语音IM和文字IM两部分。

先浅说语音IM。上文说到,那是正常人的天赋,但该天赋对不同人仍有天壤之别,有人是语音IM的超级天才或上智,有人则是语音IM的下愚[*03]。上智的语音IM丰富而多元,下愚的语音IM则贫乏而单一。这里要浅说的是语音IM的索引问题,即语音单元(音节及其组合)的排序问题。能否设想上智的语音IM具有多套索引,而下愚的语音IM只有一套索引?HNC的回答是:全人类都共享一套索引,这是上帝的安排,多套索引的设想是荒谬而不可思议的。不过,索引的具体内容有类型之分,有贫乏单一与丰富多元之别,如此而已。这是一个不寻常的话题,在浅说了文字IM之后,还要作进一步的深说。

接着浅说一下文字IM,文字基元发生变化的花样远没有语音单元那么多。如果说语音基元是个孙悟空,那文字基元顶多是个猪八戒。世界第一类语言(拼音语言)的孙悟空和猪八戒是一对双胞胎,兄弟俩长得很像,但世界第二类语言(非拼音语言)却不是这样。例如,汉语猪八戒就完全不像汉语孙悟空,那是汉字造的孽。但关键是,世界第一类语言的兄弟俩尽管长得很像,并不能相互替代,两类语言还是都需要另外一个文字IM,语音IM并不能替代文字IM。那么,文字IM是否如同语音IM一样,是人类的又一天赋呢?这个问题远不明朗。语音IM天赋的存在性可以说已经是众所周知的了,许多人都可以根据亲身体验对此津津乐道一番,但文字IM天赋的存在性则依然笼罩在浓重的迷雾里[*04]。这里只想说这么一句话,文字IM天赋也必然存在,因为上帝不会疏忽。

下面,就要专门浅说一下语言IM天赋之物理基础这个问题了。

语音IM天赋之物理基础是个什么东西?上面说到有限的音节及其排序索引,那只涉及表象,未触及本质。语音IM天赋之物理基础的本质在于:音节及其组合是一个“音义结合体”。这是语言学教科书的经典说法,按照这个说法,文字IM天赋就只能是一个臆想的东西了,因为它没有物理基础。这就是说,该经典说法似乎存在一个隐患或问题,这个问题对于世界第一类语言似乎不是一个问题,但对于世界第二类语言却不能这么说了。这个问题很有趣,因为它关系到“音义结合体”说法的完美性,它完全适用于世界第一类语言,但可能不完全适用于世界第二类语言。所以,笔者十分支持以“音形义结合体”替换“音义结合体”的说法,并曾在《理论》里写过一段呼应性话语[*05]。“音形义结合体”是对语言流的非分别说,分别说则是“音义结合体”和“形义结合体”,前者完全对应于语音流,后者可大体对应于文字流。“音形义结合体”是语言IM天赋的物理基础;“音义结合体”是语音IM天赋的物理基础,“形义结合体”是文字IM天赋的物理基础。

天赋一定存在年龄特性,语言IM天赋的年龄特性尤其值得关注,这是一点。语音IM天赋和文字IM天赋可能具有巨大差异,因为后者必然强交织于图象脑,而前者应该不存在这种交织性,这是第二点。这两点都是需要进行实验研究的课题,而且其应用价值可能不同寻常,但以往一直被忽视。本浅说愿意借机说一声,在这个全球化时代,该课题不应该再继续被忽视了。中国应该带头从事这项研究,因为汉语尤其需要关于文字IM天赋的科学认识,其研究成果可能有益于对外汉语教学,有助于汉语走向世界的伟大事业[*06]。

现在回到语言密码本的话题,也就是第二个关键词“变换形态”所张开的话题。上面质疑了“音义结合体”的说法,但质疑之声里使用了许多含糊的词语,“似乎”与“可能”是合乎常规的含糊表现手法,但“形义结合体可大体对应于文字流”的说法就不那么合乎常规了。为什么要使用这么别扭的陈述呢?因为语言密码本只有一套,并没有两套,或者说,语言密码本并不存在语音密码本与文字密码本的区分,该密码本在语言这一头只有一套索引。上文说:全人类都共享一套索引,这是上帝的安排,多套索引的设想是荒谬而不可思议的。那么,“音义结合体”的说法是否点出了语言IM的本质呢?“形义结合体”的本相是否就是“形-音-义结合体”呢?文字流的理解处理过程是否暗藏着一个“形-音转换”的环节呢?这里应该老实交代,对这3个问题,笔者自己跟自己争论了20多年,没有完全定论。于是就产生了上面的说法:语言IM索引的具体内容有类型之分,有贫乏单一与丰富多元之别,如此而已。“内容有类型之分”者,乃“K类语言”说[*07]之缘起也;“贫乏”者,文盲也;“单一”者,一种语言者也;“丰富”者,知识分子也;“多元”者,多种语言或多种方言者也。结论是:贫乏者(文盲)可以多元,无缘丰富;单一者(非文盲)可以丰富,也可以多元;贫乏者只拥有语音IM,丰富者则兼有语音IM和文字IM;丰富者的语音IM与文字IM共同享用一套索引,将名之语言IM索引。

形态变换问题就浅说这些,疑点尚多,那属于深说的范畴了。下面转向“流水般暂存于IM”的浅说。

“流水般暂存”这5个字是HNC决定以“动态记忆”替代“短时记忆”的真正缘起,动态记忆不仅是句类分析与语境分析的绝对需求,也是语言IM的绝对需求。也许可以说,动态记忆是语言密码本的关键奥秘。

发现口误是人的本能,发现笔误是丰富者的本能,在嘈杂的语音环境里,排除干扰,抓住所需,是一种更奇妙的本能;对于一位入神的思考者或阅读者,充耳不闻是一种常见现象;对于一位具有“一目十行”潜能的阅读者,跳跃式扫描是一种习惯性表现。对上述本能、现象与表现,已有的追问或许都远远不够,这里仅给出一个诱饵性追问及其诱饵性答案。上述本能、现象与表现之间是否存在一种共同的内在机制呢?答案只能是:Yes,因为相反的答案就是对上帝奇妙性的不信任。

让我们从汉语的“名字”说起,它原本是一个复合概念,名归名,字归字,分别用于自称与他称。例如曹操名操,字孟德,诸葛亮名亮,字孔明。HNC已经给那个“共同的内在机制”起了一个汉语原本意义的名字,名舍弃,字动态记忆。“流水般暂存”者,乃动态记忆之基本特征也。

好了,针对追问01的IM01可以结束了。这里又一次突出了上节三星级注释“[***09]”的地位。但该注释文字虽多,却笔力低下,甚感遗憾。

 

——IM02:激活主要是HNC概念“词典”的双向运用。

在《论语境单元》里,讲了一番动态记忆,也是“文字虽多,却笔力低下”。那里和这里的动态记忆是同一样东西么?这个提问有点傻,因为那肯定不是同一样东西,一个在语言理解处理的操作中枢SGU,一个在语言输入接口IM,怎么可能是同一样东西?但是,这两样东西却名字相同,这体现了一种意图,强烈指明两者的“心心相印”程度非同寻常,就如同量子纠缠现象[*08]那样神奇。对文字流来说,其神奇性可能远小于语音流。尽管如此,两者毕竟是两个动态记忆,因此,下文将把语言输入接口IM的动态记忆标记成DM(IM),DM则专用于SCA或SGA。

关于追问02的浅说IM02将只涉及文字输入接口IM,避开语音[*09]。在上节的那个三星级注释里,曾使用一个非常累赘的短语——“对于未来先只对付文字文本的图灵脑”,原因即在于此。

古汉语的文字文本是没有标点符号的,这里先说一段关于古文阅读的亲身感受。笔者在13岁以前经历过一段极度奇特的生涯,那时只接触过老版古文[*10]。在HNC第一阶段探索告一段落之后,笔者曾不时翻阅那阔别了44年之久的部分古书,绝大多数属于新版。新版都增加了标点符号,然而那东西给笔者带来的感受是累赘而不是便利。部分新版还给出了译文,大多难以卒读,糟蹋美味佳肴之感,“情何以堪”之叹,萦绕脑际,挥之不去。这些感受曾使笔者困惑良久,后来把它与记忆输入接口IM,特别是其中的动态记忆DM(IM)联系起来,基本得以缓解。下面就来描述一下这一困惑缓解过程的一些思考,以浅思0m编号。

浅思01:记忆输入接口IM的转换特征具有多样性,某种特征一旦建立起来,即具有高度稳定性,会伴随着记忆者的一生,长期不被调用也不会遗忘。被笔者丢弃了44年之久的美味佳肴感,再现时竟然比当年更为鲜活。这里肯定有记忆输入接口IM的贡献,而不仅仅是语境理解力提高或深化的因素。

浅思02:记忆输入接口IM的符号转换不是单个词语的个体户行为,而是一组词语有组织的群体行为,有组织群体行为是IM符号转换的基本特征。有组织的含义是:让一个群体在一个特定司令部的指挥下有条不紊地协调行动,这意味着记忆输入接口IM的中心使命是让一组词语与其相应的司令部取得联络,而不是让相继进入的文字各自独立与语言概念空间的概念基元直接挂接。独立的直接挂接方式绝对是一种幻觉,然而,该幻觉确然存在,且事出有因,不可小觑。事出有因者,查字典乃该幻觉之缘起也;不可小觑者,有人曾利用该幻觉论证过图灵脑之不可实现[*11]也。

浅思03:司令部指什么?司令部与被指挥部队(即一组词语)之间取得联络的方式是自上而下为主,还是自下而上为主?司令部与被指挥部队之间的互动如何进行?司令部的转换或交接如何进行呢?所谓记忆输入接口IM的转换特征,至少应该包含上列4个方面的问题,这4个方面的非分别说叫做激活,那是HNC最常用的词语之一。后续的浅思就是对上列4个问题的尝试性回答。

浅思04:关于“司令部指什么?”

对于HNC来说,这也并不是一个容易回答的问题。比方说,可以把司令部概括成两种基本类型,一种叫句类,另一种叫语境单元。还可以进一步说,前者可比喻成部队常规建制的司令部,后者可比喻成战场与战地指挥司令部。

就句类来说,既可以给出类似于军兵种的最高层级横向划分:作用、过程、转移、效应、关系、状态、判断与基本判断,也可以给出类似于兵团、军、师、团的纵向划分,XJ、X0J、X11J、X301J是一个样板,PJ、PkJ、P11J、Pk01J是另一个样板。

就语境单元来说,其战场与战地司令部的情况似乎比人类历史上曾经发生的任何战争都还要复杂。就战场来说,最复杂的第二次世界大战也只出现过4大战场:苏德战场、西欧与地中海战场、太平洋战场和东亚战场,撇开基础语境单元不说,仅主体语境单元即存在5大战场:两类劳动与三类精神生活。就战地来说,第二次世界大战的战地指挥部能达到万的量级么?可语境单元的指挥部数量却肯定在1万以上。

以上所说,是比喻,不妨再接着往下说三点。(1)战争或HNC的“战地指挥部”当然都不只兵团、军、师、团4级,但“战地指挥”的这种4级划分具有某种“天机性”[*12]。(2)HNC的兵团与军对应于概念林与概念树,其师与团对应于概念树的一级与二级延伸概念。(3)HNC的概念子范畴可纳入战场指挥部的细分。

上述比喻还应该从另外一个视角说一点,那就句类代码与领域句类代码的关系。句类代码SCJ就是HNC的部队,不过,投入战斗的部队与待命中的部队毕竟有所不同,于是给前者另外起了一个名字,叫领域句类代码。战争是由部队来承担的,两种基本类型司令部指挥下的部队是同一种实体,不是两种,句类代码与领域句类代码的关系就是如此。这么简明的事当年却折腾了很长一段时间,事后回想起来,不禁哑然失笑。

浅思05:关于“取得联络的方式是自上而下为主,还是自下而上为主?”

这里特意使用了“为主”这个词语,目的在于引出下面的话语。“为主”是一种存在,各种主义就是该存在的集中呈现。但是,存在jl11e2m本身就包含“无”,存在还具有

jl11e2m:(e2m,e2n,3)

的基本属性[*13],因此,HNC曾发出过“何必‘主义’之以对立”的感叹。

上面的话语试图说明,此问题的提法不妥,干吗要对谁“为主”那么重视?没有这个必要。说“自上而下者有之,自下而上者亦有之”就可以了。比方说,假定“相应司令部”已经就位,那“取得联络”的方式自然就是自上而下了。这里的“自上而下”有两类不同的含义,一、司令部指领域,二、司令部指句类。这两类司令部的功能差异很大,这在《论句类》和《论语境单元》两编里已有详细论述,但这里需要强调一点:两者实质上乃是一个“一而二,二而一”的关系,因为SC与SCD的本相就是如此。

这时自上而下的含义包括下列3点:(1)由于领域已被认定,语言输入接口IM可放手运用HNC概念“词典”,把对应自然语言里的直系捆绑词语都取出来,存入一张预期表格。(2)将动态记忆DM(IM)里的词语与预期表格里的词语进行比照,对上了号的词语自然而然地完成了符号变换,于是,相应词语的多义性困扰就会彻底消失,上述关于舍弃的天赋功能就可以大展身手。(3)预期表格与动态记忆的比照技巧是语言输入接口IM的核心奥秘,将在下文作呼应性论述。

如果一篇文字的标题比较贴切,那么,对其最初的陈述文字似乎都不妨先采取自上而下的联络方式。问题在于,言语脑如何知道其贴切与否?那么是否可以说,第一次“取得联络”的方式一定是“自下而上”呢?这些都是傻话,不过是一个由头,籍以进入HNC语言“词典”这个特殊话题。

HNC语言“词典”同已经浅说过的HNC概念“词典”什么关系呢?两者的相互关系是否相当于“英汉词典”与“汉英词典”?这里首先要说的话是,基本不相当。其次要说的话是,HNC语言“词典”是一个长期被HNC忽视的重大课题,回思HNC技术起步的匆忙,不禁痛心疾首。现在,把一些思考写在下面,供后来者参考。

让我们从“咬死了猎人的狗”和“南京市长江大桥”这两个著名的歧义短语说起,如果在两者前面分别有“那只”和“…会见了”,那曾被津津乐道的歧义表现就完全消失了。面对这类语言流,再傻的言语脑也不会把那个歧义短语先切割出来,去做“短语消歧”的傻事,这傻事曾备受关注,业界也知道那消歧要依靠上下文。但是,如何依靠呢?这么多年下来,无非是“规则或统计”这两条奇特的路,后来还出现了更奇特的两者综合之路。

规则之路遇到了上下文景象无限的困扰,统计之路据说遇到了数据稀疏的困扰。在HNC看来,景象无限的困扰只是一个假象,数据稀疏的困扰不过是一个借口,一种婉转的掩饰,面对语言流里层出不穷的罕见搭配或“新词”,统计之路肯定束手无策。有限的句类和语境单元是揭穿假象、游刃稀疏的HNC法宝,而各种类型的HNC语言“词典”是HNC法宝的第一件利器。

动态记忆DM是该利器的一种呈现形态,其建立、更新与变换方式都很Smart,数据容量也应如此。因此,短时记忆关于词语数量上限的著名发现很可能是一个误会。为了说明这一点,下面将把上面示例短语加点上下文花样,再游戏一把。

游戏1    那只老虎“咬死了猎人的狗”,

    游戏2    “咬死了猎人的狗”的那只老虎,

游戏3    一只“咬死*了猎人的猴*”

        游戏4    那**知**“咬死了猎人的狗”,

游戏5    …将路过“南京市*长江大桥”*

游戏6    “南京市长江大桥”很能干,

游戏7    “南京市*长江大桥”真雄伟,

(后带“**”或“*”的词语表示有疑点,将在正文里说明)

7个游戏的词语都超过了短时记忆的上限,这里需要进一步追问的是:(1)它们是否必须同时存在于记忆输入接口IM的动态记忆DM(IM)中呢?(2)它们都满足动态记忆更新的必要条件么?(3)它们的变换方式是否有所不同呢?(4)动态记忆会无条件接受这些语言流片段么?

现在,从游戏6和游戏7说起。假定DM(IM)的预期表格里存有下面的汉语知识项:

能干 := u7212e71

雄伟 := (xpwa219\11;xwj2*12)

那么,这两股语言流里的所谓分词歧义问题(流寇14)就会立即迎刃而解,依据预期表格提供的预期知识,语言输入接口IM确定:6在描述一个人,游戏7在描述一座建筑物或一座山峰。就游戏6来说,IM的自我感觉将非常良好,它将把这10字符的语言流捆绑成一个“信息包”递交给下面的句类分析SCA。游戏7的情况有所不同,IM的自我感觉不是那么良好,但它依然象游戏6一样,也捆绑出一个“信息包”向下传递。所述“信息包”与原始语言流的本质区别在哪里?仅仅在于用HNC符号替换了原来的“能干”和“雄伟”,其他的基本原封不动。但这一步替换极为关键,如同刑侦工作的第一步突破,认定了犯罪嫌疑人的身份。

游戏6和游戏7最后逗号的有无,对言语脑根本无所谓,但图灵脑应该对该符号采取热烈欢迎的态度。因为它提供了捆绑一个“信息包”的“充分条件”[*14]。这样的提示信息在上列游戏里的占比竟然高达6/7,达到了统计意义上的满意标准。当然,这只是顺便说句笑话,因为那1/7里还存在其他问题。

上述“信息包”是一个接一个打包的,因此,它仅存在后边界课题。该信息包将名之IM信息包,IM的唯一使命就是打包。IM信息包的基本特征可概括如下:(1)其内容可以是一个短语、一个语块、一个小句甚至是一个大句或复句,但不允许是一个语习类短语。(2)其符号形态是语言符号和概念符号的混合体。在一次阅读过程中,IM信息包里的语言符号在开始阶段可能占多数,随后逐步减少,至于最终是否会减少到接近于0,不必深究。(3)IM信息包不是一个完全被动的符号转换者,它具有一种不可思议的舍弃功能,同时还具有不可思议是怀疑功能。下面用这3项内容来考察一下上面的7个游戏。

言语脑的考察结果如下:(1)游戏1、6、7是一个小句,游戏2、3、5是一个语块,游戏4存疑。(2)游戏1-3仅“咬死了”未进行符号转换;游戏4的“那知咬死了”都未进行符号转换;游戏5仅转换了一个“将”,其他都保持原来的自然符号;游戏6仅转换了“很能干”,而且转换符号是“u7212e71(c33)”;游戏7仅转换了“雄伟”。由此可见,IM之后的HNC符号转换的任务可能很艰巨,也可能很轻松。(3)游戏4的“那知”一定要释疑,游戏3里“猴”和游戏5的“市”则不一定,因为言语脑的IM大约也做不到,那是后话。

上述3项考察实质上规定了后续句类分析SCA和语境分析SGA(下文将简称两分析)的3项任务:一是为每一个IM信息包正名,也就是让它们各得其所;二是将IM信息包里所有未转换的自然语言符号施行HNC符号转换;三是实行质疑处理,不能释疑者或等待,或请求援助。下面来查看一下上述3项任务的执行情况。任务1是两分析的必然结果;任务2是两分析的必经过程;任务3是两分析的可能呈现。这个排序违背了自然性,任务1与任务2交换一下比较好,这就不要去管它了。

下面,对IM的基本特征略作阐释,说3点。

1)在言语脑里,语言流从自然语言符号到概念符号的转换是分阶段进行的,有即时方式(即时,real time,信号处理领域通常翻译成实时),也有非即时方式。即时方式在记忆输入接口IM进行,将名之即时转换TRT;非即时方式在两分析阶段进行,将统称延时转换TDT。以上所说,对于言语脑是假设,对于图灵脑就是模拟法则。两分析阶段各自完成的转换将分别符号化为TSC和TSG,两符号含义不言自明。

2)即时转换TRT第一要保证可靠性,宁缺毋滥。具有组合歧义的词语一律不入选;第二要保障简明性,该词语最多两义项,义项数≥3的词语一律不入选。这是IM的两条基本游戏规则,上述关于假设与法则的话语这里依然适用。上列7个游戏就是这么玩的。

3)为了实现上述可靠性和简明性,必须为IM配置一个小而精的专用词典。这个专用词典是上文所说HNC语言“词典”的一种特殊版本,也是“预期表格”的一种特殊形态,专用于取得联络的自下而上方式,可视为IM的核心机密之一。

上文说,这部“词典”是HNC法宝的诸多利器之一,当时冒昧地放出这个话,还围绕它给出了许多论述,那确实显得很突兀。这么呼应一番之后,笔者觉得尽力了。

以上三点,属于理论技术接力范畴的内容,这违背了本《全书》的撰写初衷。但《论记忆》的编首语已有申明在先,不算犯规。

IM来说,所谓“自下而上”就意味着与司令部失去了联络,本浅思着重论述了在这种情况下的对策。

浅思06:关于司令部与被指挥部队之间的互动

标题里的“被指挥部队”是指语言输入接口IM,文字上是一个新话题。但此“新”是理论技术接力意义下的新,这里的互动实质上在《论句类》和《论语境单元》里已经作了充分论述,这里不过是借助上列7个游戏,说点感慨性话语或“废话”而已。让我们从两个带“*”的“市”字说起。

游戏5与7里的“市”是多余的字,因为那里说的对象是“长江大桥”,一座特定的建筑物。从这个意义上说,如果语言流里果真出现了“南京市长江大桥”这么一组词语,那么,其词语切分实际上根本不存在歧义现象,“南京|市长|江大桥”的切分方式是唯一的选择,因为它说的对象必然是一个特定的人,这是游戏6的选择。人与能干、建筑物与雄伟的搭配堪称“绝配”,语言流一定是若干“绝配”的呈现,没有“绝配”的语言流就不是语言,至少不是规范语言,把“南京长江大桥”弄成“南京市长江大桥”就有失规范(下文将简称失范)。但失范语言现象就如同失范社会现象一样,具有吸引眼球的价值,其被过度重视就不必奇怪了。

言语脑不难发现“绝配”,对语言流里的失范现象具备高度敏感性,图灵脑能做到这一点么?这就不能不说一说下面的“废话”了。所谓“司令部与被指挥部队之间的互动”就是指更有效地寻求“绝配”,从而发现失范。自然语言的符号体系把这些“绝配”搞得面目全非,造成了无数的“咫尺天涯”悲剧,HNC的目标不过就是恢复这些“绝配”的本来面目,从而为消解“咫尺天涯”悲剧提供多层次的世界知识。

HNC探索第一阶段结束时,提出过“同行优先”的说法,它是这里“多层次的世界知识”的原初形态。就游戏6来说,“市长”与“能干”是比较容易辨认的“同行”,就游戏7来说,“大桥”与“雄伟”是绝妙的“同行”,但在游戏5里,似乎就不存在“同行”之类的东西了。对“同行”这个概念或术语,早就应该深入追问一系列问题,然而却一直处于按兵不动状态,上文所谓“痛心疾首”[*15]者,此其第一号也。下面就来梳理一下有关“同行”问题的要点,以同行0m编号。

同行01:同行的原意不仅用于描述指近距离搭配(即语块内部搭配)的符号特征,也用于描述GBK要素之间、GBK与EK要素之间的符号特征。这一点原来没有说清楚,下面将分别有所论述。

同行02:绝妙型与易辨认型“同行”在语言流里占有多大比例?是门可罗雀,还是门庭若市?这是一个十分重要的数据,却一直阙如,这是一项尴尬。但更为尴尬的是:以往仅强调了抽象概念五元组之间的同行,却未强调x类概念与相应具体概念之间更为可爱的同行,实际上后者比前者更有实用价值。游戏6和7都生动展现了这一可爱性,可以说,这一疏忽造成了巨大遗憾[**16]。

同行03:GBK要素之间的同行性表现实质上就是句类知识的一种体现,不同句类的表现度差异很大,表现最为突出的句类叫简明状态句S04J。汉语偏爱该句类,英语很少采用,但也会在迭句中偶尔出现[*17]。游戏6和7都是简明状态句,该句类的游戏规则最简明[*18],SB与SC核心要素之间同行性表现最突出,两者的间距也极度靠近。游戏6的“市长”与“能干”乃是绝配,游戏7的“大桥”和“雄伟”也接近绝配。这些绝配会激活一种强大的预期威力,这种预期威力不仅足以使游戏6、7里的“南京市长江大桥”分词歧义现象一下子烟消云散,甚至会同时对游戏7里的“市”字,产生一种是否多余的疑惑。下文将把这种预期能力叫做合适感[*18],绝配也许是合适感里最具活力的一种形态,言语脑的奥秘就在于它具有强大的合适感,情感脑和艺术脑的这一特征也十分突出。依笔者的愚见,要搞好HNC的理论技术接力,必须在合适感的培育方面下大力气。如果没有这种感受,HNC理论技术接力就不可能彻底摆脱传统规则思路的非灵巧特征,句类分析SCA和语境分析SGA就不可能达到预期的水准,图灵脑也就绝对没有希望。反过来说,如果一个语言知识处理系统善于发现绝配并善于利用合适感所蕴涵的丰富世界知识,那上面的“不可能”就会变成“可能”,上面的“没有希望”就会变成“大有希望”。合适感如此重要,怎么到这里才给出这个术语呢?说来话长,但主要是笔者的迟钝所致。前面曾说过“HNC黄埔军校”的戏言,这里来一个该军校的校训:意识与智力的生命,不是语法与逻辑的学习,而是合适感的培育。这当然又是一则戏言,不过是为了强调一下合适感的极度重要而已。

合适感是句类和语境单元的函数,不同的句类有不同的合适感,不同的语境单元也有不同的合适感,句类空间和语境空间的合适感又有天壤之别。这一点,在《论句类》和《论语境单元》里已经给出过系统的论述。但句类空间和语境空间都是庞然大物,遗憾的是,在那些论述里可能过于强调了两者的庞大特征,而忽略了“庞大寓于简明”的阐释,此简明者,句类空间之广义作用效应链(亦名广义主体基元概念)也,主体语境空间之两类劳动与三类(也叫三层级)精神生活也。这些话似乎过于玄虚,能否用一些不太玄虚的话去替代它们呢?也许加一段下面的话语是适当的,然后,再回到上列7个游戏加以具体说明。

句类空间形式上似乎并不庞大,基本句类的数量不过68组[*18],但混合句类的数量却高达千计量级。与传统语言学的4大句类说和6大句子成分说相比,HNC的句类说显然是一个庞然大物,难以赢得受众或普及。这意味着HNC从诞生之日起,就面临着一个可名之“消解庞大性困扰”的艰巨任务或使命,“HNC黄埔军校”的想法就是这么诱发出来的。在撰写《全书》的过程中,此项任务的艰巨性不时涌现于脑际,有时甚至会严重干扰撰写的思路,但毕竟也因此而逐步形成了一些感受,下面略说其一。

该感受仅针对句类空间,其要点可概括成下面的两句话,第一句是:在庞大性困扰面前,要善于凝练;第二句是:在凝练过程中,要善于选择具体对象,并投身于热烈的HNC“恋情”。凝练的要点是:基本句类归根结底只有8大类,于是混合句类就可以凝练成56类。各大类之间的差异十分鲜明,这一鲜明性很容易带入混合句类,句类新表就是为了这一凝练与带入的便利而重新设计的,其中最明显的改动有两个,一是新表里的Y-01o、Y-02o、Y-03o、X-12、X-13和X-24。二是重新制定了混合法则,以求得最大简明性。这里故意不使用句类代码,而使用句类编号,那是为了暗示如下的反省:原设计的广义作用句大节不亏,小节有大量失误;广义效应句恰恰反之,小节基本无误,而大节有亏。至于HNC“恋情”的选择,确实一言难尽。不过,不妨说一句普通不过的话:千万不要搞什么“风情万种”,而没有一次真正的“恋爱”。基于上述感受,对专利文本的机器翻译,笔者仅仅推荐过一个需要重点研究的对象,叫双对象效应句,编号B-17。在读了朱筠的博士论文以后,这里愿意再次表达推荐之意。如果HNC团队只顾得“收获秋天”的忙碌,并由于忙碌而“风情万种”,从而惧怕进入那“初恋”预备期的寒冷冬天,那句类分析SCA技术的春天还能到来么?

下面回到7例游戏,从游戏7说起。

游戏7会联系于什么样的语境?为了回答这个问题,不妨设想一个如下的描述过程:第一步,与范畴“q7表层第二类精神生活”挂接;第二步,以跨越一步的方式,与概念树“q741旅游”挂接。接着应该发问:这样的两步挂接方式可以保证万无一失么?回答是:依据一个孤零零的游戏7肯定做不到这一点。再傻的言语脑也绝不会做这样的傻事,它一定要在左顾右盼(古汉语文本是上顾下盼)之后,才能作出向哪一株概念树挂接的最终决策。这就是言语脑的天性或天赋,它以句群为信息处理单位,而不是单个的语句。这就是《论语境单元》的基本缘起[**19]

当然,游戏7的语境可以隶属于概念树“q741旅游”,但也可能隶属于概念树“q745‘出差’”、“观赏q721”或其他。游戏7的语句是“观感rq702\1”的典型呈现,该观感可能缘起于旅游、“出差”、观赏或其他,我们看到,旅游与“出差”属于同一片概念林q74,但观赏则属于另一片概念林q72,两者都属于q7的殊相概念林,而观感则属于这群殊相概念林的根概念林q70。

上面的两段话语特意携带了HNC符号,一方面试图表明:游戏7的上下文(语境SG)在自然语言符号空间可以自由翱翔,但在语言概念符号空间,就享受不到这样的自由了,它逃不出子范畴q7的佛掌。至于它最终落在q7的哪一株殊相概念树,或该概念树的哪一项延伸概念,其上下文一定会提供明确的依据。那大桥是写者亲眼所见,还是写者由某一展览所见,也会有所交代。另一方面则试图询问:在包含游戏7的DM(IM)里,如果说言语脑可以从中获得明确的世界知识,那么,倚仗着上列HNC符号,为什么图灵脑就不能获得?顺便说一声多余的话,如果已认定游戏7属于q7,那个“市”字就是一个人为的多余。对此进行语法分析似乎是必要和有效的,但那分析本身是否又是一次人为的多余?至于统计分析,那是否纯粹就是一种高级玩笑呢?

接着说游戏6。它主要是为了表明该游戏的语境将与游戏7截然不同,那里的“市”字不可或缺,仅凭着“市长”这个词语(注意,它可不是动词,其HNC符号是pa12ae22*),就足以将输入语言流纳入概念林a1。游戏6的DM(IM)不仅一定可以提供特定概念树a12的充分信息,还一定可以进一步提供其特定延伸概念的充分信息,例如最终可纳入概念树“a12国家治理与管理”的3级延伸概念

      a123e213          民政

这两个示例游戏试图向读者传递一项HNC无比珍视的信息:数以万计的语境单元何足道哉?提纲挈领可也!这纲领,可概括成如下表述:句类+领域,这两者之“+”是纲领,“+”意味着一体,不区分主次、阴阳与上下,但需要区分躯体与灵魂;句类是躯体,领域是灵魂;句类代码只是一个没有灵魂的躯体,领域句类代码则是生命;句类的语块只是一个躯体的一个物理构件,而领域句类的语块则一个生命体的生理部件。语言流原初形态的生命特征处于沉睡状态,言语脑的使命不过是实施唤醒。这唤醒本身是一项技术,是现代科技尚未进行认真探索的一项崭新技术,牵涉到一系列的崭新课题。这些崭新课题的探索,实质上就是理论技术接力的一次崭新探索,语言输入接口IM和语言动态记忆DM(IM)乃是此项探索的先锋部队。先锋部队负有侦察和扫除外围障碍的特殊使命,必须配备相应的特殊武器或资源。在《理论》阶段,曾把那特殊武器概括成(l,v)准则,这项概括具有尖刀性,但远不全面。上面添加了一件武器,叫“小而精的专用词典”,后文将简称“绝配词典”。这里再添加一件武器,叫“样板句类”。“能干”一定入选“绝配词典”,但“市长”并不入选。简明状态句Y-20一定入选“样板句类”,但基础效应句Y-01o一定不入选。总之,可以毫不夸张地说,哪些词语该纳入“绝配词典”,哪些基本与混合句类该纳入“样板句类”,是HNC理论技术接力课题里最大的大场和最急的急所。这里突然冒出“样板句类”这个术语,部分读者可能很不习惯,请稍微耐心一点,在下面“咬死了猎人的狗”的有关游戏里会提供一些具体说明。

言语脑是否拥有“绝配词典”与“样板句类”?这不必枉加猜测,但图灵脑肯定需要这两样东西,两者主要为IM而配置,但后续的SCA和SGA不仅也可以使用,而且必须使用。

“绝配词典”与“样板句类”不是两件孤立的武器(硬件),必须依靠相应的使团(软件)才能形成一个强大的武器系统。如果该武器系统的功能得到了充分运用和发挥,那么,传统意义下系列难题(即HNC概括的劲敌与流寇)的解决方案就会出现新的思路、谋略或途径。这里涉及的传统难题包括:游戏6和7里的分词消歧,游戏6里的人名(江大桥)辨认,游戏7里的“市”字多余性和新词“大桥”的辨认。新思路的要点就是所谓的“三二一原则”(或“321原则”),就这里的游戏6与7来说,那就是:当上下文没有任何其他信息的前提下,输入语言流的整个“南京市长江大桥”部分将被当作一个未知,直至那个“能干”或“雄伟”出现,而这两个词语将被当作一个已知,于是,一个“未知向已知”看齐的处理方案就开始启动。非常神奇的是,这么一看齐,那输入语言流中未知片段里的重重迷雾就会烟消云散,语言分析的种种难题就会迎刃而解。这一翻天覆地巨变的诀窍在那里?回答将竟然如此简单,诀窍就在于“绝配词典”和“样板句类”的存在,“能干”和“雄伟”一定赫然存在于前者,而S04J一定赫然存在于后者。言语脑的实际运作过程是否如此简明,暂且不论,但未来的图灵脑必将或必须如此。

游戏6与7的目的性似乎讲得比较清楚了,下面转向游戏5。

游戏5似乎比较麻烦,如果段尾没有“,”,该语言流唯一的“已知”只是一个“将”。除了上述“未知”之外,它增加了一个两字孤魂[**20]“路过”。“将”的已知性来于HNC语言理解处理的另一项资源,将命名为“lf词典”[*21]。因此可以说,游戏5在IM接口这个环节几乎无戏可玩,其动态记忆DM(IM)仅能完成“将”的符号变换。面对这类情况,IM应该如何处理?这就要说到HNC语言理解处理的又一项资源了,将命名为“灵巧字典”[*22],两字孤魂里的孤字“路”与“过”,上述“未知”里的“桥”都可能出现在该“词典”里。而它们联起手来,或许能提供某种惊喜,将名之“意外绝配”。实际情况可能是:游戏5里的3个孤字可能都与HNC符号“22b”发生联系,若果真如此,那就提供了“物自身转移”的“意外绝配”信息。如果能敏锐地抓住它,那就会出现从“疑无路”到“又一村”的巨大转机。言语脑是否具有这种功能?这也不必枉加猜测,但图灵脑多半需要这项特异功能,如果希望未来的图灵脑能够轻松地读懂中国古籍,那就更是必须的了。“灵巧字典”将在下文作进一步介绍,至于它引发的“意外绝配”,则将发配到《微超论》里,这里只是一个引子而已。

上面以挤牙膏方式粗略讲述了语言理解处理必须具备的4类资源:“绝配词典”、“样板句类”、“lf词典”和“灵巧字典”,其中的带“典”者都属于前述HNC语言“词典”,将合称配套“词典”。顾名思义,配套“词典”并不是HNC语言“词典”的主体,主体部分将名之主体“词典”,它由HNC概念“词典”反向转换而来,仅在反向这一点上,主体“词典”与概念“词典”的关系才与英汉或汉英词典大体对应。

前文曾为主体“词典”的编辑方式写下了许多话语,这里就不作任何补充了,配套“词典”是HNC语言信息处理亟待补充的资源,但并非全部,也许同样重要甚至更为重要的资源是“样板句类”。这4类资源是静态的,还有4样动态资源,将分别命名为“流水句类”、“流水领域”、“流水对象”和“流水内容”,4“流水”[*22]可以说是动态记忆的配套,而前面定义的动态记忆则是动态记忆的主体。这8项东西共同构成HNC语言知识处理系统的完备配套资源。

写到这里,不禁想对“游戏5似乎比较麻烦”的话语加一句下面的回应:“但实际上并没有多少麻烦”。

最后,拟以下面的表述充当“南京市长江大桥”游戏的结束语,没有配套、只有主体的资源不是Smart资源,没有配套、只有主体的动态记忆不是Smart记忆。Smart资源和Smart记忆是消解一切歧义游戏的利器。

下面来考察“咬死了猎人的狗”游戏,为它搞了4把再游戏,拷贝如下,同时给出HNC标注。

游戏1    那只老虎“咬死了猎人的狗”,        X0P4J

    游戏2    “咬死了猎人的狗”的那只老虎,     GBK

游戏3    一只“咬死*了猎人的猴*”            GBK?

        游戏4    那**知**“咬死了猎人的狗”,        SCJ//GBK?

依然以合适感为准绳进行考察,言语脑对游戏1与2会产生合适感,而对游戏3与4则会产生不合适感。但文字重点将放在“灵巧词典”的浅说。

游戏1与2都把歧义短语“咬死了猎人的狗”里的歧义一扫而光,用传统语言学的话语来说,游戏1里的“那只老虎”是主语或施事,“咬死了”是及物动词谓语或施加性动作,“猎人的狗”是宾语或受事。此描述之简明确实是登峰造极,造成了一种“高山仰止”的幻觉。但是,游戏1的HNC标注则打破了这种幻觉,施加性动作多矣,言语脑岂能不加区别。基本句类新表的30种广义作用基本句类(编号X-01到X-30)的谓语都符合“施加性动作”的定义,由其牵头的30*67=2010种混合句类也是如此。从这个数量可知,“语句无限,而句类有限”的HNC第二法则(句类空间法则)未免过于庞大了,所以上面特意提出了“样板句类”的概念或术语。X0P4J拟纳入“样板句类”,它将专用于延伸概念(作用过程混合)“14ebn3”的描述。“样板句类”都需要其他配套“词典”的配合,前面举了“绝配词典”的示例,这里将给出“灵巧字典”的示例。

下面介绍一下“样板句类”的4项示例:X0P4J、XY0J、S0R62J和S0P4J,每个句类都要配置自己的使团,而某些使节可能还拥有自己的“灵巧字典”。

——X0P4J使团的基本阵容如下:

X0P4J <= 14(~eb5)3//14ebn3;

DOM := a59a9//q726//q612

X0A(14eb63) := (pa59a9/p;jw62u00c33);

X0A(14eb73) := (p321a;pa82);

X0A(14eb53) := pa82,

X0B(14eb53) := (p5314eb5(d35),jw62\7xjw62e22u5314eb5(d35));

(作用对象对应于临产孕妇,或临产的雌性哺乳动物)

(DOM,l14,jw62) =: (q726,q612),

X0B(jw62) =: (jw62u00~c33,p);

 

初期的对应“灵巧字典”如下,以“外使”形式予以表示,下同。

      (X//O+,死) := 14eb63

      (狮;虎,豹;狼;鳄;鲨;) := (jw62u00c33,jw62-9\a)

(狗,犬;) := (jw62u00c32,jw62-9\a)

 

——XY0J使团的基本阵容如下

      XY0J <= 14ebm*3+309e2n*3

DOM := ay

      A := pa+pea

BB := a01//ay

      BC := r14ebm

 

初期的对应“灵巧字典”如下:

(X,活) := 14~eb2*3

(X,活) := 14eb2*3

(活力,生气,生机) := BC(14~eb2)

(崩溃,危机) := BC(14eb2)

 

——S0R62J使团的基本阵容如下:

S0R62J <= 14eb6+50+462

DOM := 3228\k//(a84\3;a43)

SB := (pe;pj2*;wj2*;pj01*-00;p)

SCB := (p,jw62,jw61)

SCC := j41c2n

 

初期的对应“灵巧字典”如下:

(死,了) =: EK

 

——S0P4J使团的基本阵容如下:

S0P4J <= 50+14ebn

DOM := 50a\11

SB := f32\0

SCH := (wj10*;wj10*+)

 

对应“灵巧字典”的“外使”配置如下:

(生,于) := 14eb5

(死,于) := 14eb6

(活,了) := 14eb7

 

通过以上4个示例,概述了“样板句类”和“灵巧字典”的知识表示范式,仅供参考,目的在于促进HNC概念“词典”和HNC语言“词典”的启动与建设。此范式涉及到一系列原则性与技术性问题,将分别在注释“[*23]”和“[**24]”里作必要说明。

下面简说一下游戏3与4,两者都涉及所谓“不合适感”的话题。合适感与不合适感都的言语脑的天性或天赋,两者的孪生性就如同正反、善恶一样,所谓“自知之明”大体上就对应于合适感与不合适感的非分别说。这里想强调的是,就语言理解处理来说,不合适感与合适感的培育同样重要,前者甚至更为重要。就未来的图灵脑来说,不合适感的培育不仅是理论技术接力的重要课题,也是技术产品接力和产品产业接力的重要课题。

游戏3与游戏4有所不同,后者带有“,”,前者不带,因此,言语脑IM对两游戏的处理方式也应该有所不同。对游戏4可以启动IM处理,对游戏3则应该采取等待策略,如果那“猴”是第一次出现的话。这里在暗示着一个比较深层次的课题,那就是IM不能对输入语言流采取绝对信任的态度,文字流可能出现笔误或缺失,这就引出了纠错处理的课题。言语脑具有纠错处理的天赋功能,图灵脑安能置身事外?游戏3与4的安排,就是为了对纠错处理做一点初步考察。

但这项考察谈何容易,但也不要只是望天兴叹。如果有那么几十个(不是全部)基本句类和几百个混合句类(整个句类空间的一小部分)拥有上面所示例的“样板句类”,那不仅IM、SCA和SGA都可以大显身手,纠错处理也可以启动。反过来说,如果“样板句类”和上述配套“词典”(包括“灵巧字典”)都接近于“空”,那HNC技术(自然语言理解处理技术)肯定就走不出“忽悠”的低水平阶段。

游戏3和游戏4都可能需要纠错处理,那带“*”和“**”的字可能有错。当然,纠错处理通常是SCA和SGA的事,不是IM的事。但是,如果游戏3带有“,”,那IM就要承担起一定“责任”。下面就来说一说这个IM“责任”问题,这得从“灵巧字典”说起。

先说一段关于“灵巧字典”的题外话,该“词典”并不是汉语的专利,英语也需要。下列符号存在的存在就是上述论断的基本依据。

down,of,off,on,up,

-ly,-ion,-ism,

ad-,pre-

当然,英语对“灵巧字典”的需求度远低于汉语,其作用也不像汉语的“灵巧字典”那样功德无量,但它对于英语理解处理的SCA和SGA分析,也必然大有裨益。

回到IM“责任”的正题,让我们从“灵巧字典”的两位“外使”说起。一位是前面已给出的

(X//O+,死) := 14eb63

另一位是下面的“外使”或“使团”,将简称“伤使团”。

(X,伤) := (509a,l16,jw62u00~c31)——[伤-01]

  (狗,犬;猪;蛇;) := (jw62u00c32,jw62-9\a)——[伤-02]

  (熊;猴;) := (jw62u00c32,jw62-9\3*e21)——[伤-03]

(牛;) := (jw62u00c32,jw62-9\b)——[伤-04]

(驴;骡;) := (jw62u00c32,jw62-9\3*e22)——[伤-05]

这“伤使团”非同寻常,5位外使都赋予了特殊编号。下面将写一段“非同寻常”的说明,它涉及到一项令人畏惧的课题,那就是世界知识与常识的交织性。CYC之梦的破灭,与这一课题的处理失当有密切联系。下面将浅说游戏3与“伤使团”的联想处理,在此之前,需要对5位“外使”略加介绍。

上面介绍过“生死活14ebn”的概念组,这里需要先介绍一下“伤亡509a*o01)”的概念组,这两项概念组之间存在如下内使:

       14eb6 ≡ 509a*d01

       14eb7 = 509a*c01

这两位概念基元空间内使带有自延伸符号“*o01”,在HNC符号体系里,自延伸符号这个概念的正式推出,大约是2007年的事,在其前的“望尽”与“憔悴”阶段,经历过10年以上的折腾。该折腾期间的一些思考过去隐而未说,下面补作一些交代。

HNC集中关注联系于语言脑的知识,并把这项知识命名为世界知识,以与高端的专家知识和低端的常识相区别。该命名的前面实际上省略了“语言”二字,因为各项非语言脑也会拥有自己的世界知识,此省略不过是文字上的一种卸包袱举措,特此说明。

世界知识必然会与高端的专家知识和低端的常识分别发生交织,交织性知识的表示是CYC的“死穴”,也是HNC的难题,可名之交织性止步难题,或简称止步难题。两端的止步难题具有时代性、范畴性、地域性和交叉性(专家知识与常识的交叉)特征。时代性特征集中呈现于第一类劳动和第二层级精神生活,故以符号“q”予以简约表示,其低端止步难题多于高端;范畴性特征集中呈现于第二类劳动和第一、第三层级精神生活,其高端止步难题远多于低端;地域性特征集中呈现于深层精神生活和语法、语习逻辑概念,基本不存在止步难题;交叉性特征则集中呈现于主体基元概念,两端都存在复杂的止步难题。

止步难题的解决,HNC采取彻底开放态度,绝不包干,仅向后来者赠送一件“法宝”,取名自延伸。它是HNC最为珍视的术语之一,同时“约法三章”。

——“约法”01:自延伸仅用于任何概念基元的头与尾,不可用于插入。

——“约法”02:尾部自延伸符号包括:(1)语言理解基因的全部第一类氨基酸符号;(2)语言理解基因的全部第二类氨基酸符号或其特定逻辑表示;头部自延伸符号包括:

r;52,53;x;6m,9,c;rw,gw,pw,o;(~,^)。

——“约法”03:自延伸部分以符号“(…)”表示。

“约法三章”显然比较粗糙,故一直“犹抱琵琶”,今天才正式露面。这里把两个遗留问题交代一声,一是对低端与高端延伸未加区分,这属于“自弃”;二是嫌自延伸符号“(…)”书写麻烦,有时以符号“*”替代,这属于“自乱”。前文似乎说过“不拘小节”的坏习惯,这“自弃”与“自乱”,是该习惯的典型表现。

在政治斗争、战争、刑事案件、恐怖事件以及各种其他天灾人祸的语境里,伤亡是多么重要的概念,可是,在HNC符号体系里,如此重要的一个概念竟然落得一个自延伸的地位,这是否需要反思?回答是:在设计延伸概念509t=b的时候已经深思过了,所以,对该延伸概念使用了一个比较特别的汉语命名:“生命的异态表现”,其汉语说明可作为上述回答的证据,现拷贝两句如下:生命状态509的t表示509t=b描述生命体的非正常状态,即自然语言所说的疾病与伤残。符号“509a*o01”仅涉及伤,还有另一个概念大户:残。写到这里,笔者想借这个机会,写下两段题外话。

题外话01:主体基元概念是整个HNC理论体系的理论基础,在《全书》里的编号是第一卷第一编。该编定稿于1995年,其时正值笔者的生命的异态之时,故力求文字简练。

 

 

 

浅思07:关于司令部的转换或交接

 

 

注释

[*01] 认知心理学当前是一个经营有方的杂货店,但不是超市,与沃尔玛相比,还有很大的距离。

[*02] 这里的舍弃本质上就是上节所说的舍弃,这就是说,舍弃不仅存在于记忆转换环节,也存在于记忆输入接口环节。这意味着舍弃这个东西存在于语言理解处理全过程的两头。若果然如此,那就很难想象,这个东西会在该过程的中间环节完全消失。舍弃这个术语与话题是为了未来的图灵脑而引入的,该术语的最终选定很费了一番周折。最早的时候有3位后选词:抑制、掩蔽与舍弃,放弃“抑制”是为了与神经生理学切割,放弃“掩蔽”是为了与意识心理学切割。第一项切割是由于图灵脑是纯粹的物理学,不涉及化学和生物学,第二项切割是由于意识心理学主流学派的关注点依然是一些离奇古怪的东西,对图灵脑采取漠视或否定态度。

[*03] 语音IM超级天才有不少杰出人物,清华大学国学院四大导师之一的赵元任先生就是其中之一。语音IM的下愚也存在,笔者就是。一个在北京生活了一个甲子以上的人,普通话竟然完全不合格,尾音“n”与“ng”的区别,说不出来,也听不出来。回到阔别多年但毕竟曾经连续生活过7年的故乡,竟然听不懂大量的故乡话语。当时笔者自己也很错愕,后来才明白,那主要是由于笔者幼年生活过的仰山堂,有自己的一套独特语音,那独特性导源于两个因素,一是仰山堂建筑的隔离性;二是多位历代仰山堂媳妇来于外省外县。

[*04] 20世纪的中国对文字IM天赋的存在性,持一种绝对否定的态度,这十分奇特。并据此采取了若干重大行动,从而对20世纪的中华文明大断裂作出了不小贡献。中华文明的特殊性及其20世纪大断裂是一个十分复杂的重大文明课题,前文曾依托于对一些概念树的阐释略有所说,散布于不同的概念树。其要点是:面对列强的全球征服浪潮,当年中国可采取的最佳对策是仿效地缘态势曾十分类似的俄罗斯,政治上加强集权,经济上大办实业,在此基础上大力推进军事变革,这些举措才是“那个最危险时候”的急所。这些举措当然会牵涉到文明传统的重大变革,但对文明传统不能使用枪毙(现代叫休克疗法)的简单方式,不能搞大断裂。不过,回望当年则不难看出,辛亥革命以后,要在中国进行第二次十月革命,枪毙传统中华文明的简单方式确实是一个无与伦比的政治高招,拿准了政治谋略的急所。传统中华文明不是扶不起的阿斗,前文对此给予了许多分散的论述,这里想推荐的是一项概略性说明,原文拷贝如下:

    中华文明的基因特征是:神学哲学化,哲学神学化,科学边缘化,始终未能形成神学、哲学和科学各自独立的完备学术体系,本质上无宗教信仰,可简称“三化一无”但是 “三化一无”并非“百无一是”,其“愚者千虑之一得”对后工业时代的文明建设或许具有极为重要的启示意义。当然“三化一无”说需要专家的训诂,本支节将仅从世界知识的视野对此作两点论述。第一、传统中华文明是世间唯一的无神论文明,这一论点与“神学哲学化”相对应;第二、传统中华文明是世间唯一的理想型或理念性文明,这一论点与“哲学神学化”相对应。要想认识中华文明的特色 要想认清中华文明的优势与弱势 就必须抓住这两个要点。

(见“理想行为73219的世界知识”支节[123-2.1-1])

    此段文字,是笔者多年文明思考的心得,是坚信第二世界得以继续存在、第二文明标杆必将在未来得以建立的依据。从当下中国社会状态的表象来看,该依据确乎已经荡然无存。但是,此特定依据的所指并不是一个社会的表象,而是一个社会的文明基因。中华文明基因存在于中国人的语言脑里,就如同犹太人的文明基因存在于其语言脑里一样,语言脑里的那个文明基因会那么容易荡然无存么?

[*05] 该段话语见《理论》pp25-26,拷贝如下:

语言文字作为一个整体,都具有音、形、义三极,不过“形”这一极在西语里居于从属地位,所以传统语法理论只提音义两极。但汉语是典型的三极语言。两极意味着对义的表达只有音一种手段,这种语言基本不依赖于文字而独立发展。三极则意味着对义的表达有音形两种手段,文字与语言同步发展并对后者产生重大影响。对音的运用属于人类的本能,对形的运用则涉及更高级的智能,因此,汉语对音形两种表意手段的运用必然体现更多的智能性,这是它的长处。但同时又限制了它对语音本能的充分运用,这又是它的弱点。汉语的这种双重性在词汇构成方面表现得最为明显。语言的发展从词汇起步,词汇的基本功能是命名,在命名方式上,汉语与西语的巨大差异不仅是饶有趣味且极富启发性。古汉语的基本命名以单音节为限,几乎不越雷池一步,显得非常原始和笨拙。西语对一个命名的音节数量则不加约束,显得十分灵活和洒脱。但是,命名的需要随着社会的发展而层出不穷,当新的需要出现时,汉语采取以原有单音节汉字重新组合的方式予以表达,充分显示出其灵活和洒脱。西语则恰恰相反,原有词的音节数量一般已不适于再行组合,不得不采取另造新词的原始方式,从而显示出其灵活中的死板和洒脱中的笨拙。这样,汉字就成了一个Chinese character和word的混合怪物,两千余年来基本上只减不增。依靠约一千多个充分基元化的汉字,汉语对新概念的表达应付裕如。这确实是一个有力的启示,表明菲尔墨和山克所追求的概念基元(primitive)的完备集合应该从汉语的这些充分基元化的汉字集合里去寻找。

[*06] 文字IM天赋的研究涉及脑力开发的课题,也涉及某些脑部外伤疾病的治疗课题。语言IM都需要动用大脑的左右两半球,但文字IM的动用强度可能更大一些。这些课题都很有趣,但并没有现成的答案。

[*07] K类语言”说前文曾多次提到,但并未给出定义,仅略说过英语、汉语和阿拉伯语原始书写方式的巨大差异,从而让它们分别充当世界第一类语言、第二类语言和第三类语言的代表。

[*08] 量子纠缠的英语词语是,也译为量子缠结。

[*09] HNC探索刚走过第一阶段之后,为生存所迫,曾不得不去直接面对语音文本的音词转换处理,《理论》的论文3(pp60-79)反映了那段时光的无奈挣扎。

[*10] 笔者接触古文的过程分两个阶段,第一阶段从4岁起,历时6年多,那是抗战期间在仰山堂的事。依据父亲写定的古书清单,老师教我背诵,不得作任何讲解。第二阶段从11岁起,历时两年多,那是抗战后的事。大约父亲认为我可以继承家学,决定以传统方式亲自指导我的学习,不进学校。这段时间才对以前背诵过的小部分古书略有理解。不过,在那段时间里,一有机会,我就瞒着父亲进入武汉大学图书馆顶层的阅览室,已经是“身在曹营心在汉”了。1948年春,实际上相当于武汉大学子弟学校的东湖中学成立,我终于得以结束那“一段极度奇特的生涯”。

[*11] 该论证者是一位语言哲学家,叫…

[*12] 这里的“天机性”有两项含义,一是HNC提倡的“二生三四”说,二是长期存在于中华帝国的4级行政管理体制,如今的名称是中央、省、地、县。

[*13] 这一延伸符号的意义请参阅本全书的[230-112]小节。

[*14] 关于逗号的“充分条件”说适用于现代汉语,但不适用于英语,现代汉语为此创新了一个符号“、”。此贡献非同小可,但也不无遗憾。所以,对充分条件加了引号,因为许多语习类概念对应的词语不必独立打包,但它们也常带“,”。

[*15] “痛心疾首”无不与理论技术接力有关,这里的小弥补不过是提醒而已,不是代劳。

[**16] 这关系到多元逻辑组合和串联第一本体表现这两个紧密相关课题的研究。当该项研究遇到具体概念和x类概念时,天空就会出现曙光,从而为相应规则(包括自身的组合规则和不同语言之间的变换规则)的制订指明阳光大道。遗憾的是,许多研究者都与此天赐良机失之交臂。多元逻辑组合属于概念树l45,串联第一本体表现(含voovou)属于一级延伸概念l42t=b,笔者在撰写相应章节时,搞一点接力又何妨?可是当时纯理论本分的想法杜绝了这一努力,铸成了意外遗憾。

[*17] 这就需要用到迭句的概念,汉语偏爱迭句,英语罕用;汉语偏爱简明状态句,英语罕用。两语种在语句层面的这一表象差异,与“汉语四合院”和“英语高楼大厦”的表象密切相关。这是一个很有趣的课题,对于英汉两种语言互译的句式转换具有重要实践意义。机器翻译的理论技术接力探索有许多战场,这是其中最容易取得成效的战场之一。可惜在专利文献的机器翻译中,用处不大。所以,这里写下这些话,仅聊以备忘而已。

[*18] 合适感或合宜感这个术语不是笔者的发明,而是来于亚当斯密先生的《道德情操论》,英文是the senses of propriety

[*18] 基本句类总数的原说法是57组,希望读者忘记这个数字。

[**19] 前文曾多次提到HNC得益于训诂学的启示,曾给出过简略诠释。但在专业意义上,笔者是训诂学的绝对外行,不能不低调说话。不过,这里要说一句,言语脑天性的探索是一个关于语言本体的的实质性课题,西方传统语言学一直回避这一课题,这是它的明智性表现,中国训诂学不具有这一明智性,这是它在20世纪曾惨败于现代汉语的原因之一。故笔者近年常念叨“莫以成败论英雄”的汉语古训。

[**20] 孤魂是HNC探索《理论》阶段常用的术语,《定理》以后不再使用。近年,日益感受到其独特的激活价值,准备重新启用。但其约定范围将小于原来意义的孤魂,孤魂的选定将与“灵巧字典”和“lf词典”的建设结合起来进行,这是一个事关HNC理论技术接力的大课题,如今在酝酿中,拟通过一系列小沙龙而逐步启动。

[*21] lf词典”是

[*22] 4“流水”里的对象和内容是取句类空间的定义,还是取语境或记忆空间的定义?这是一个有待探索的大课题。这里只是提出来,留给后来者去完成。

[*23] 本注释略述“样板句类”的若干原则问题。

“样板句类”这个术语是最近提出来的,但其原始思考则在《理论》里已有大量描述。占据着新旧基本句类表最醒目位置(头与尾)的两个句类(XJ和S04J)曾是笔者心目中的样板,《理论》曾为它们花费了大量文字,但前者最终却失去了独立进入“样板句类”的资格。

原则有理论性主导与实践性主导的基本区分,“样板句类”的原则属于实践性原则,这是首先需要明确的。“样板句类”的实践性原则大体可以概括成以下5个要点,列举如下:

要点01:服务于3层级语言概念空间之间的贯通。

要点02:服务于不同代表性语言之间的句类转换指示。

要点03:服务于语块构成的复杂性指示。

要点04:服务于句类检验的捷径指示。

要点05:“样板句类”一定要配置相应的“灵巧字典”。

5条服务性原则是HNC一以贯之的老调,因为HNC深信言语脑理应如此。但为什么缺乏一个强有力的集中表述?那是对接力环节采取“若即若离”态度的缘故,而这种态度乃是“审时度势”的必然结果。不过,其中的要点02和要点03毕竟有一个不错的开端,前者有张克亮教授的专著,后者有李颖、王侃、池毓焕的专著《面向汉英机器翻译的语义块构成变换》。

S04J由于符合两项要点标准(02和04)而入选“样板”,XJ则由于无一符合而落选。

[**24] 本注释略述“样板句类”和“灵巧字典”的一些技术性问题。下面的文字将涉及到一些回顾,重提那些陈年旧事,对读者一定是沉重的负担,其探索价值也不好把握或展现,只好姑妄写之。

基本句类代码的数字表示大体上仅触及到主体基元概念的概念树,连相关概念树的一级延伸概念都基本没有进入,这成了HNC的一块心病。汉语广义作用句的句式变化具有非常独特的表现,现代汉语研究仅注意到“把”字句之类的语言现象,完全局限于就事论事的形而下描述,缺乏一个形而上的理论提升。于是,HNC及时引入了格式这个概念或术语,对汉语广义作用句的独特句式变化加以概括。但是,却把一项“水到渠成”的同步性理论提升“得意忘形”掉了,那就是:广义作用句与广义效应句的句式应该赋予不同的命名。于是,样式的正式命名竟然迟到了15年之久。这件事,是HNC的另一块心病。

这两块心病曾不断作祟,最典型的事例有:(1)S041J和S042J句类代码的荒唐引入;(2)句式符号表示“各自为政”,迄今未作终极清理。两块心病作祟度的减弱与消除过程屡经周折,很不顺利。不过现在可以说,其终极结束的标志是句类新表的制定和“样板句类”框架的草拟。不言而喻,制定与草拟存在本质差异。关于制定的基本思考已经交代过了,下面说一下关于草拟的有关思考。

“样板句类”的草拟框架包括下列思考,以草框0m(m=1-4)编号。

——草框01:“样板句类”的基本知识有三。

1)句类代码SCJ与主体基元概念的挂接;(2)领域DOM与领域基元概念的挂接;(3)GBK核心要素与各类概念基元的挂接。这3项挂接知识简记为挂接1、挂接2和挂接3,三挂接都属于前文定义的外使。

3项挂接知识都需要作深入研究,这里仅浅说一下挂接1与挂接3。

1997年举办第一届HNC培训班的时候,不少学员反映,词语的作用效应链划分往往十分困难,尤其是过程、效应与状态的划分。这项反映给笔者留下了深刻印象,当时的答疑效果多半是越答越疑。现在回想起来,如果当时拥有X0P4J使团、XY0J使团、S0R62J使团和S0P4J使团的教材,其中的4位第一号使节就是非常有说服力的教员。

挂接3最值得研究的课题是其速效特征,具体挂靠概念的速效性最为显著。可惜,此项特征似乎未受到应有重视。具体挂靠概念的速效性首先来于该类概念的顶层5分:(rw,gw,pw,o,oj)。这5组符号本身及其前挂符号x所蕴涵的信息或世界知识弥足珍贵,是扫荡诸多流寇、特别是流寇13-16的利器,岂可不善加运用,甚至不知运用!说句比喻性话语吧,这5组符号所对应的名词大多属于名词里的“婆罗门”,如果编辑一部“婆罗门”名词词典,那就是创新,更是善哉。

——草框02:同一句类代码可用于不同领域。

本草框与下一个草框都是十分重要的命题,都是HNC理论技术接力里的“大急”课题。HNC以往关于这项课题的论述存在一定误导或失误。通过这两个命题的陈述方式,希望能够产生一定的纠正效应。

在“样板句类”的4项示例里,前3项都用于多个领域。它们已为此项课题提供了必要的感性认识,下面说两点理性认识的话语。

第一点:句类空间的成员以百计,而语境空间的领域成员却以万计,这意味着草框02所表述的命题具有天经地义特征。

第二点:领域不仅有类型的区分,还有作用效应链的区分。就主体语境的概念树来说,多数概念树是作用效应链的全方位呈现,但也有部分概念树侧重于作用效应链的特定环节,最有典型意义的示例如下表所示。至于语境概念树的延伸概念,具有全方位呈现特征者属于罕见情况。即使是含有语言理解氨基酸“β”

的延伸概念,其全方位特征,一分别说就完全失去了。

 

     表:侧重作用效应链部分环节描述的语境概念树示例

 

HNC符号        汉语说明                  优先句类

7101           对广义作用的心理反应       X29J//

7102           对广义效应的心理反应       X20J//

7103           对关系另一方的反应         R01X21J//

7111           对事业的态度               X21XJ//

7112           对亲情的态度               X21R11J//

7113           对友谊的态度               X21R21J//

7121           期望                       X20Y0J//

7122           愿望之实践                 X21Y0J

7123           愿望实践后                 (S0T0J;S6Y0J;S3Y0J)

 

领域的类型区分是纯粹的理论范畴,领域的作用效应链区分有所不同,它可以纳入理论技术接力范畴。本《全书》正是这么做的。然而,这并非最初的撰写意愿,《全书》最早撰写的部分留下了相应的痕迹,曾多次嘱咐池毓焕博士加以保留,特此说明。

——草框03:同一领域可以容纳众多句类。

本命题特意使用了众多这一词语,此众多,非通常意义的众多,而是对(jD;jDm;D;Dm)等句类的刻意强调。在奥巴马国情咨文的语料里,我们见识过jDJ的特殊表现。

——草框04:“样板句类”未必在对应领域的描述中实际呈现。

HNC曾反复表达过这样的态度,对诗歌、神话、童话等文体,HNC无能为力,这基本是由于对草框04现象存在一种畏惧心理。但有时也流露过比较乐观态度,那是由于觉得该现象HNC未必不能对付。

 

 

第三卷 第四编 第四章 3

 

记忆输出接口OM浅说

 

 

 

第三卷 第四编 第五章

 

广义记忆(MEM)杂谈

 

引言

本章的标题文字不取浅说,而选取杂谈。浅说带有浓重的探索性,杂谈就可以避开,这是本章与上一章的基本区别。但两者又有共性,那就是随意,不理会现代论文或专著所要求的各种形式规范。

本章也分3节,目次如下:

1节 广义记忆交织性杂谈

2节 语言记忆(ABS)特区杂谈

3节 拷贝记忆杂谈

 

 

第三卷 第四编 第五章 1

 

广义记忆交织性杂谈

 

 

第三卷 第四编 第五章 2

 

语言记忆ABS特区杂谈

 

第三卷 第四编 第五章 3

 

拷贝记忆杂谈