HNC词语注释大全1

词 形

挨近

 

[注 ]

[说明1]cmn 的内在矛盾

[说明2]+f83 的含义,语用特征

 

词 形

爱戴

 

[注  ]

[说明3]JK1、JK2 的关系特征

 

词 形

爱好 (嗜好)

 

[注  ]

Λ表示两个条件同时存在

[说明4]关于优先表示之例外

 

词 形

安定

 

[注  ]

[说明5]关于 vu 类概念

 

词 形

安家

 

[注  ]

[1]请注意家庭这一概念的映射符号

[2]符号=>>对语义块表示变换;对句类表示转换。

 

词 形

安静

 

[注  ]

这里修改了《现汉》两义项,从环境状态和生命体状态两个角度去表述安静的语义和语用。[说明6]关于 jw2y

 

词 形

安乐

 

[注  ]

[说明7]关于乐与悲、宁与燥

 

词 形

安排 (安置,安插)

 

[注  ]

安排与安插映射符号相同,但安排有五个句类代码,而安插只有三个,这就是两者语用之不同。给出相应的例句,可以成为HNC语义学之样板说明

 

词 形

·安全

 

[注  ]

此词映射符号值得细看。要点如下:

[1]是典型的r类概念,又是典型的u类概念,可以说沿用名词等词性概念无从说明“安全”的概念类别特征。

[2]“安全”是预防性防害措施产生的效应,故53不可缺。

[3]“¥”概念组合符合可形成各种类型的概念类别,不单是效应型动态概念(动词)。

[4]两种映射符号都是正确的。由此可以体会一下底层结点的网络性。

 

词 形

安身

 

[注  ]

表面上,此词为vB结构,《现汉》标记为an∥shen,表示中间可以插入。但有两类插入,一是可插入其它语义块,二是只能插入自身的附加成分。如这里的插入“下了”、“了”。对于第一种插入,将在映射符号给出f83“义素”,如前面的“碍事”。第二类插入则不加此“义素”,仅在组合结构类别上注明“7”即可。这个规则早已确定,不知纳入规范否?

 

词 形

安生

 

[注  ]

[说明8]关于符号‖之双用

 

词 形

安稳 (平稳)

 

[注  ]

(删去方言中的稳重义)

 

词 形

安息

 

[注  ]

 fpec821*y

   y=1 

   y=2  基督

   y=3  伊斯兰

   y≥4 待定

 增加了义项1

 

词 形

安闲

 

[注  ]

《现汉》释为安静清闲,这里去掉了安静义,仅保留闲义。[说明9]关于50aa。

 

词 形

安心

 

[注  ]

《现汉》“安心”给了两个义项

  <1>  an∥xin   居心

  <2>  an xin    心情安定

第一义项应放入单字知识库中,

第二义项应加可插入符号,如“安不下心”、“安下心来了”等,如果按《现汉》标记方法,则带插入者为第一义项那就大错特错了。在类别中加了vC,即为了表明这一特性。

 

词 形

安葬

 

[注  ]

如果对一个词只赋予动词词性,即只有v类别,那么,该词要么充当Eg,要么充当El ,这是纯v词语的根本特点。这里,也给出El知识表示。关于包装,要大力加强知识表示。包括包装的前后标记,包装所用词语。以上所述的新内容,可暂不入库,但我认为非常重要。

 

词 形

按脉=号脉,诊脉,切脉

 

[注  ]

[说明10]关于学科分类

 

词 形

按压 (抑制)

 

[注  ]

按压有动作义,《现汉》未取,此处也作罢。

 

词 形

暗笑

 

[注  ]

未录高兴义

 

词 形

岸然 (严肃)

 

[注  ]

[说明11]u的S041J/SC表示

 

词 形

盎然

 

[注  ]

[说明12]关于自然环境的中层表示

 

词 形

翱翔

 

[注  ]

[说明13]关于PB与SB

 

词 形

傲视

 

[注  ]

《现汉》“傲慢地对待”不准确,现改为积极的意义。

 

词 形

跋扈 (专横)

 

[注  ]

[说明14]关于s语义网络的设计

 

词 形

把风

 

[注  ]

“把风”不兼“把守”义,《现汉》有误。

 

词 形

把玩

 

[注  ]

[说明15]关于f2及f21的设计

 

词 形

罢官

 

[注  ]

[说明16]关于a019 a01a

 

词 形

百出

 

[注  ]

v,z)表示并,不能分开用。

 

词 形

百年

 

[注  ]

 [说明18]关于量词的Eu语用

 

[注  ]

 [说明19]关于包装的信息表示

 

词 形

百十

 

[注  ]

[说明17]关于近似值的表达

 

词 形

摆弄

 

[注  ]

未取《现汉》玩弄义

 

词 形

摆设 (bai3,she4)

 

[注  ]

[说明20]关于54的底层设计

 

词 形

拜师

 

[注  ]

[说明21]杂谈

 

词 形

帮忙

 

[注  ]

帮忙的分离现象极为有趣,“帮了△的大忙”、“越帮越忙”等。

 

词 形

褒贬 (bao3,bian3)

 

[注  ]

bao3,bian5 的褒贬未取

 

词 形

包藏

 

[注  ]

仅取隐藏义

+f82表示该词主要用于成语“包藏祸心”

 

词 形

包场

 

[注  ]

此例可作为教材,同时应说明,此词义可能扩展到一般娱乐场所。因此,将

+va32a改为+(va32a;v9721)

或许更妥当些。

 

词 形

包抄

 

[注  ]

此处的p4369并不确切,曾建议过用“p-”符合,但似乎又规定p-仅用于类别表示,故待定。软件人员请同时献策。

 

词 形

包饭

 

[注  ]

这里从承包者角度对“包饭”作语义表述。表面上隐去了辞典所强调的“交付费用”这一要点。但是,这一要点是所有λ64 的共性,所以这一知识“形亡实存”。这一点值得领会。

句类代码的取法倒是值得进一步考察,因为664隐含着关系,实际上,Cn可插入到E和EH之间。因此,应该加

R011T2*22J

E+[EH|]        [ |]-分离统一符号

RB2=>>Cn

的表示,这就能分析诸如

我在△△吃包饭

我吃△△的包饭

之类的句子了。

从承包者的角度,(又是“轮流坐庄”)还应有下列句类代码:

R012X100*22J

R012X10*22J      !11

这就能分析诸如

我们负责××的包饭

我们对××包饭

之类的句子了。

可见,“包饭”语义表示仅有一项,但句类代码竟有五个之多。我们把这种语言现象定义为动词语用性的主体内容之一。

表述上列语言现象的基本工具是

  (1)基本句类代码,它的灵魂统帅作用;

  (2)E块构成表示式EQ+E+EH及其各种特殊情况;

  (3)E块分离现象的可表述(形式化)及可把握;

  (4)混合句类代码的合理运用。

    而这一切的基础是动词映射符号所表达的语义。

但是,有了这些工具或概念,是否就万事大吉了呢?当然不是!动态概念(动词)语用性主体内容之二是既可充当Eg,又可充当句蜕中的El和块扩中的Er。就“包饭”来说,在

我让他给你(我,他…)包饭

的语句中,包饭就是T3XY*32J的Er了。在

在△△吃包饭既方便又合算

的语句中,包饭就是S041J的El了。

在语词知识中,一般不给出Er  El信息,但对某些词语也可以例外。我已经试着做了,读者可以参考。

西语对 El 采取形态化的方式予以标志,从而有利于Eg与El的区分。对于to+ 和 +ing的方式简单明了,但是,对于+ed,+tion,+ment,+cal,+ly…的方式并非仅有利(功)而无弊(过),对El的本质,对抽象概念的五元组特征,是否产生了某种模糊、掩盖的消极影响呢?我认为应该进行这一反思。还应该说明,to+ 和 +ing的方式也不是区分Eg、El的绝对可靠标准,自然语言的任何形态化只能解决部分或大部分语言现象的表述,不可能彻底。语言的疑难最终都要靠理解,句类分析提供了一种模拟大脑语句理解过程的计算模式,如此而已。

“包饭”在《现汉》里分到两个词条。其实,语义并无差异,只不过在概念类别(词性在这里不好用了)上存在vC与g之分而已,所以HNC把两者并为一个词条,一个义项。关键在于其句类代码竟达五个之多,这才是知识表达的要害。

写了这么长的说明,后面还改用毛笔(而且所用之墨乃同治年间产品),为什么?希望读者对HNC的方法论和思考方式有所理解。

有人说,学习HNC要先解决信仰问题,这是无知加恶毒的表现,无知与恶毒常常联系在一起,不足为怪。但是,HNC的思考方式,对传统语言学来说,确实是一场变革。

以上所说,给读者的感受是“那人却在灯火阑珊处”?还是“如堕五里雾中”?不管是什么,这里都要加上一句,HNC 的路程还很长很长,且不谈后面的三个模式,第一模式中的某些高层设计尚未进行,底层设计所缺更多,已设计而未登记者为数不少。进入工程化谈何容易,无众志成城之势,只能在港湾中试航,难以在大海中乘风破浪也!

     众志成城

     独傲成势

此老夫所深愿也。

(“独傲”二字之义请参看“难点”p35)

                      仰山下人

                      2000年7月28日夜

 

词 形

包工

 

[注  ]

读者由此例可体会T491J,T492J之设计思想并非简单的买卖,并可知X109J设置之必要了。

 

词 形

包裹 (包扎)

 

[注  ]

由这里的v54-可知,v54-概念节点必须存在,但似乎不存在相应的词,也许用“成为一个体结构”可以表达v54-的意义。

 

词 形

包销

 

[注  ]

请再次体会T491J、T492J之辩证运用

 

词 形

保健

 

[注  ]

通常vC类概念都具有可插入特性,但保健很特殊,不能插入。

 

词 形

保留

 

[注  ]

“保持,保存,保留”各有个性,又有共性,请读者注意比较三者的异同。所映射者未必准确,群策群力之功,可就此例加以展示。

 

词 形

保证 (承诺)

 

[注  ]

请读者参阅《现汉》对义项2的说明,它仅仅把该义项当作名词来处理。从五元组看,该义项下也有动词含义,就是本映射符号给出的意义。而且形成常用的因果句。

 

词 形

饱满

 

[注  ]

《现汉》的两义项都是状态的度表示,故合二为一。

 

词 形

报偿

 

[注  ]

[说明22]关于v01之省略

 

词 形

报答

 

[注  ]

[说明23]关于“关怀”

 

词 形

报关

 

[注  ]

[说明24]关于语言逻辑组合

 

词 形

报请

 

[注  ]

[说明25]关于五主块句的格式

 

词 形

报销

 

[注  ]

 a20 的底层节点曾定义为   a20*1  市场

                      a20*2  产品

                      a20*3  管理

                      a20*4  财务

 

词 形

报应

 

[注  ]

λ82y之第三层曾设计为

λ820  幻想

λ821  神的存在

λ822  灵魂的存在

λ823  报应说

λ824  轮回说

 

词 形

爆发

[注  ]

《现汉》给出了三个义项,核心语义都是<1>的映射符号所表达的“突然发生”。这里分为两义项,将《现汉》的义项1改为“喷发”义。《现汉》用了49个字说明<1>的语义,其实那已不属于语词的语义,而是语用的范畴了。弗雷格先生的名言“词只有在语句中才有意义”,维特根斯坦先生的名言“一个词的内涵就是它的使用”,对于“爆发”的义项<1>是恰当的,这使得相应句类代码的 JK 预期比较困难,但这样的词在汉语里比较少。所以,对于名家的名言,要留意天才的偏颇,任何天才都有偏颇职业病。其偏颇倾向甚至比常人更为严重,故以“职业病”名之。上列两位大师的名言,是这一职业病的典型表现。

义项<1>中的代码符号 S022 在目前的句类代码中暂缺。对于 S02 代码,应加上

S021J=SB+S021+SC

S022J=SC+S022+SB

两个辅代码,S021J 在形式上与S0J 相同,但 S0J 的SC 不限于广义空间,而 S02 中的SC 必须是广义空间。这项约束(信息,知识)太重要了,值得为之单独设置代码。当然,S02m 的设计主要是为了形成相应混合句类的需要,但某些词语确实具有 S02m 的特性,虽然很少,但多少不能成为是否设置一个代码的依据。对 X109J,X200J 的设置,曾出现过以此为由的疑问,所以顺便写下了上面的话。

词 形

爆炸

 

[注  ]

[说明26]关于 54- 的底层设计。

《现汉》只给出了义项<1>,说明也不够全面,特别是未指出“巨大的推力”这一效应,其后继效应是“巨大杀伤力”,“巨大的声响”只是效应之一,这里把两者都表示了。“爆炸”还有第二义项,指人们外引发情绪之一的 7134(现节点表说明不符合“论文15”的定义)急剧高涨,映射符号比较准确地表示了这一点。映射符号中都给出了关于对象的预期知识,这类知识不要求全,但要求抓住要点,例如义项<2>中的 p- 就是要点。实际的语句可能省略这一信息,用“全场”之类广义空间概念来替换,但这里的表示方式可激活相应语义块的深层省略。此词我花费了将近一个小时的时间,读者不妨精看。其中有关 54- 的映射符号早有定义,未收入目前的节点表,可参看说明:“关于 54- 的底层设计”。

                            仰山下人

                             2000.8.1. 夜11时半

                                       于614房间

 

词 形

抱病

 

[注  ]

符号“=>>”表示转换或变换。此处表示“抱病”这个纯动词仅充当复合句类的E1,但这个E1 一定变换为E2 的 QE。这就是说,某一类纯动词并不能独立构成句子。因此,对纯动词也不能作出一定是 E 的假设(规则),这确实对软件设计造成了巨大困难。那么是否将这类动词的类别符号记为 (uv,v) 或 uv+v 的方式呢?这个问题暂不决定,待心中有“数”以后再说。

 

[注  ]

 《现汉》只给出了义项<2>。

 

词 形

抱拳

 

[注  ]

此词《现汉》加了符号“∥”似不妥,类别符号未按此处理。这里只给出了高层表示。由于此词已经过时,不详加映射了。

 

词 形

卑怯

 

[注  ]

《现汉》用“卑鄙怯懦”的解释不妥,请体会这里的映射符号。

 

词 形

背叛

 

[注  ]

词义的褒贬性具有强烈的立场性,比较难掌握。ju860;ju861+ju751;ju862+ju751 是三种不同的表达方式。第一种方式表示对立立场双方的褒贬义完全不同,而中间立场持贬义。后两种方式表示该词的中间立场观点。

 

词 形

奔波

 

[注  ]

u(f44) 表示以否定形式陈述的 u 概念,如“不已,不停,没完没了”。

 

词 形

奔窜

 

[注  ]

这个表示式不唯一。首先,可以采用双重逻辑结构表示式,将第一项中的¥内容改为 Rt。其次,¥项中的r4005也可以写成 v03a&r4005。这些都未规范。隐含的约定是:凡 #,¥后面的 v 都是针对另一对象,如果是自身(反身动词)则必须注明,一律用符号r4005。

 

词 形

奔丧

 

[注  ]

Λ――并

 

词 形

笨拙

 

[注  ]

义项<1>表示方式我并不满意,也许有更好的方式,应沙龙一次。(之二)

 

词 形

崩裂

 

[注  ]

义项<2>是我加的,还应该有谈判。

 

词 形

逼近

 

[注  ]

我分为两个义项,应语料验证。

 

词 形

逼视

 

[注  ]

我分为两义项。注意<1>的230。

 

词 形

逼真

 

[注  ]

删去了义项<2>

 

词 形

鄙俚

 

[注  ]

未取“粗野”义

 

词 形

笔伐

 

[注  ]

突出了语境 a13,注意双重逻辑组合方式。

 

词 形

笔耕

 

[注  ]

分为两义项  义项<1>相当于“写作”,但语用不大相同,义项<2>相当抄录。

 

词 形

笔记

 

[注  ]

映射符号中的底层数字9含T1信息。底层之用,应沙龙多次。《资料手册》之不同于节点表,要害之一在此。说句心里话,节点表早该进历史档案了。

 

词 形

笔试

 

[注  ]

!1 是规范格式下的情况

[说明27]关于219u的设计

 

词 形

笔挺

 

[注  ]

    此两义项的映射符号涉及多方面细节,分述如下:

  第一,518是物的形态,这里则专指衣服,必须加以说明。51ab 是人的站立形态,故不必另加说明。

  第二,衣,食,住这三样东西,都采取挂靠方式给出第一表示项。

        服装(广义)      pw65330

        食品(比食物窄)  pw62221

        建筑物            pw6554

服装突出其显隐功能,食品突出其生理基本的物质需要功能,住突出建筑物的“结构体”特点。65表示人类特有的产物,鸟兽的巢,洞就不包括在内了,另用6254表示。

  第三,广义服装包括衣,帽,鞋及其它(如围巾,手套等)。

        定义pw65330*1为衣,至于各种类型的衣,则用展开项表示,如雨衣为

          pw65330+v376b&jrvw628

  第四,x54-001表示直,而非竖直。但因51ab

       已包含竖立义,故可省略。竖直映射

       符号为

          x54-001+j2186

 

词 形

比较

 

[注  ]

“比较”的三个义项,《现汉》的解释都很精当,次序也依照原来的。“比较”作为动词,有两个句类代码,一是jD000J,二是XjD000*21J。第一种代码可采用 !2格式。所有的两语义块广义效应句都有这种可能性,特别是效应句YmJ。所以,以前曾分别给出两种格式,后来取消了,赋予这类代码具有 !2格式的天然特征。

在基本句类表示式中,并非所有的格式都采用JK1+E的格式,变换句中就有E+JK1的基本格式。与这类代码混合时,如果要从它那里取出一个广义对象语义块,那对象是唯一的。因此,如果该代码属于混合句类

E1E2*21J

E2,那程序就得具有取其唯一广义对象的灵活性。这么一件小事,从规范化来说,就是大事。这种情况把E1E2*21J改成E1E2*211J似乎就规范了,但我没有管它。

    当比较充当E块时,无论是哪种代码,该句都是复合句或复句的E1J,这一特征必须注明。在E1J与E2J之间,必须有逗号,不能是句号。而且,E2J一定是对E1J比较结果的说明。由此可见,jD000J代码是为了复句的表示而专门设计的,如同许多代码是为了方便混合句类的表示一样。当然这些代码本身也具有独立存在的价值,但想到要设计这些代码的起因,是前者而不是后者。这些话,过去“述而未作”,现在仍然是“作而不细”,可见,“述而不作”者并非都是名士派头,有人是具有一种特殊的懒惰性,我就属于后者。

 

词 形

比武

 

[注  ]

两字词vC类概念中的C属于高层概念的情况占绝大多数(甚至是全部?),vC具有动词和名词的双重属性。作为动词使用时,应该补充C的底层内容;作为名词使用时,其底层以FKQ出现,这些语法现象都值得深入考察。HNC把这类语法现象与语义联系起来,vC无底层,必然是相应高层之底。逻辑语言学的真伪论证,其实也离不开这一概念脉络的本质特征。如果只搞什么“图形的三角”、“当代法兰西皇帝的帽子”、“ 《维弗利》的作者是司各脱”之类的逻辑真伪论证,不论如何精密,也只是象牙之塔的游戏。比武与比赛的映射符号与句类代码差异,不只是语义问题,更不是逻辑问题。这个差异既要在知识表示中体现出来,又要让软件善加运用,当然难度很大。但是难道还有什么其它捷径可以达到理解的彼岸么?

我所填写的绝不是都是样板,但它提供了一种思考方式。我想传留下去的是这种思考方式,其要点是:1.词的映射符号,应首先体现该词联想脉络的主干,可以暂时抛弃细节,但主干必须突出;

2.该词的概念类别特征,应特别关注映射符号中的类别符号与类别项中的类别差异。这种差异表明该词的词性表现是多方面的,更准确地说,其语用特征是多样化的。而两种类别符号无差异的情况就极其宝贵。宝贵的突出事例之一是,如果两者都只是v,那么该词必须充当E,当然不一定是Eg,可以是El,Er等。该词前后带“的”字也不影响这一特性。这样性质当然是宝贵的。汉语的动词里有不少的这样的亮点,要把这些亮点紧紧抓住。

3.句类代码力求全面。语言哲学家和语义学家关于词语可怕性的种种名言,实际上都是多句类代码造成的,把句类代码表达全面了,可怕就变为可控了。与西方的有关名言相反,黄侃先生却说了一句针锋相对地另一名言“一字之义明,则数字之义亦必无不明”。黄先生是述而不作的典型学者,我们看不到黄侃先生对这一重要论断的详细论证。但可以肯定的是:黄侃先生必然具有与多句类代码相对应的明确认识。否则,作为一位严谨有条的国学大师,他是不会使用“必无不明”这一断然论断的。

用“大师”二字称呼黄侃先生,我是在60年代初偶然在一篇谈到黄先生的文章中看到的,其中的“卓然一代大师而未见成书,岂不惜哉”至今记忆犹新。文章作者叫刘渝生。听我父亲说,刘先生是孙中山先生在南京任临时大总统时的总统府秘书长,学识渊博,为人豪爽,趣事极多。章太炎先生曾打趣刘先生,“渝生麻于面而不麻于心”,(刘先生是大麻子,但夫人却是美国人),渝生先生答曰“信然,信然。”当年,日本和西方的汉学家带着古汉语的疑难问题,来中国寻求高人解答,往往最后找黄侃先生拍定,没有出现过黄侃先生不能拍定的疑难,这是绝对的事实。所以,我是“必无不明”论断的深信不疑者。反过来看西方大师们的与此不同的名言,我是持反思态度的。当然,“必无不明”的实现,并非阳关大道,但依靠多句类代码这块路标,“必无不明”的彼岸是可以到达的。

4.充分揭示E块的复合构成,这种复合构成一般与格式相联系,在可能出现分离时更要细加标明。

在填写上述四个要点时,如果能对照语料库来进行,那是最好不过的了。但我不使用语料,那太费时间。所以,对个别词,我加了“用语料验证”的标注。这只是偶而为之,该检验而未标的情况必然甚多。这份资料只是基础,其完善有待来者。

 

词 形

闭气

 

[注  ]

这个词频度不高,但其Cv vC特征比较典型,作为El的转换功能也很典型。

 

词 形

庇护

 

[注  ]

庇护可以设贬义,不可同于包庇,在有贬义时,程度低于包庇,所以用了 +{ju862c31} 符号。

 

词 形

庇荫

 

[注  ]

庇护可以设贬义,不可同于包庇,在有贬义时,程度低于包庇,所以用了 +{ju862c31} 符号。

 

词 形

鞭挞

 

[注  ]

TA为参照,叫鞭挞;以TB为参照,叫指责;不考虑参照点,叫批判、批评。

 

词 形

贬值

 

[注  ]

vz为映射类别符号的概念,意味着E~JKm(m=1,2)的同行性,是一项极为宝贵的知识,为了突出这项知识才保留了映射类别符号vz。这里贬值义项<2>的存在是否降低了这一知识的宝贵性?我认为恰恰相反。当同行性检验被否定后,可推知该句的“贬值”为义项<2>。这可以提炼出一条普遍形式的法则,包括孤魂的发现和消除。

 

词 形

辩解

 

[注  ]

“辩解”一词语义并不复杂,但语用比较复杂,需要三个句类代码,为什么代码3不能作为代码2的省略形式来处理,读者值得思考。关键在于这里利用了基本句类的语义块构成知识。

 

词 形

变换

 

[注  ]

“变换”的语义,《现汉》给出了一个高度概括性的确切说明,这里予以细化。细化表示需要 s21,s22 的高层完善。目前定义如下:

s210   思考方式

s211   作用方式

s212   效应方式

s213   关系方式

s220   一般方法

s221   作用方法

s222   效应方法

s223   信息处理方法

 

词 形

变脸

 

[注  ]

[说明28]关于 a31、a32 的底层设计

v13a的转化是针对对偶性概念而设计的。其内容是转化后的,意味着从原来的对偶方转化而来。如这里的v71152,表示原来是v71151。还应指出,v71152不能用 !v71151代替,如果属于这种情况,应采用v309‖!v71152的表示方式。通俗地说,v13a表示180度大转弯。应从这个意义去理解当前已登记一对中层表示

v13an

的汉字说明。

 

词 形

变天

 

[注  ]

  a13n  为三重对偶

  a131  国家当前统治者对造反者的镇压

  a132  造反者对统治者的造反

  a133  被推翻的统治者不甘心失败,对新统

        治者的“造反”命名为复辟。

 

词 形

变相

 

[注  ]

类别符号绝不能用 u,因为“变相”不能充当 S041J 的 SC。

 

词 形

变心

 

[注  ]

对义项<1>中的 u4081 要不要加上 { }?未得良策。R0S*11J 的删除与此有关,也许另加不带 u4081 的义项取 R0S*11J 代码为妥。

义项<2>中的 gd208 反映射“忠诚”,d2y8 的原始设计如下:

d208  忠诚

d218  公正

d228  信用

d238  知足

d248  关怀

也许可用。

 

词 形

变性

 

[注  ]

va82*2 的 E 块构成,通常采用 (EQ+E+EH) 结构,而且经常将 YB 插入到 EQ 与 E 之间,如 E 省略,则 EQ=>>E,YB 插入到 E 与EH 之间,这似乎可形成一条生成规则。

 

词 形

便秘

 

[注  ]

w62222*y 曾作过详细设计,一时查无着落,只得暂缺。所谓详细设计,不只是编号,还有一系列特征表示。

 

词 形

便血

 

[注  ]

从此词以后,对 v5099 又加了一层数字 9 和 a, 9 表示现象学命名,a 表示解释学命名。

 

词 形

表现

 

[注  ]

“表达、表明、表现、表示”四个词的语义共性与个性在其映射符号中已尽力加以显示。“表明”中第一次使用的表示方式更希望引起大家讨论的兴趣,目的在于揭示 JK1~JK3 之间的概念关联性。“表明”与“表示”之间在语境指示符上的差异也请留意。在四个词的语境层次差异使我又一次感到,自然语言不是不可捉摸的,关键是捉摸的方式要对头,句类代码是基本依靠,如果没有这个靠山,那真是漫无头绪了。

 

词 形

表象

 

[注  ]

“表象”应该是典型的名词,但汉语也可以用它做动词。或者换句话说,j742 的动态概念汉语只能也可以由它来承担,这就是类别符号 g,v 填写的依据了。欢迎讨论。

 

词 形

表演

 

[注  ]

义项<3>是添加的,“文化大革命”中常采用此义。这里需要说明的是,332 的底层与 331 完全对称,3329 的意思大体是以假乱真、伪装、明显暗隐,即变隐为显。如科索沃战争中,南斯拉夫人就采用这种方法对付北约的空袭。义项<2>中的 v5251,大约任何语言中都不存在相应的词语,意思包括“动作,图象演示”等。

 

词 形

别扭 (bie4,niu5)

 

[注  ]

710 高层第四位数字按 s21 的第三位设计。7102,3 的意义有所不同。7102 表示广义效应对反应者所产生的心理反应,7103 表示反应者作为双方的一方而产生的心理反应。

 

词 形

摈除

 

[注  ]

《现汉》对摈用抛弃、排除释义。而这两对双字词都多义,“弃”有关系和效应之异,“除”有积极与消极之别。这里对“除”取消极义,对“弃”取效应义,是否准确,未作求证。

 

词 形

并联

 

[注  ]

双对象效应句应设置两个代码

Ym021J=YB1+Ym021+YB2

Ym022J=YB2+Ym022+YB1

YB1 为多个组合单元,YB2 为单一组合体,这是定义。

混合句类代码 XY9021*311J 的复合 E 块 EQ+EH,中间可以插入逗号,形成语串间分离,例如,

把这些△△并联起来,就可以形成一个××。针对这一情况,也许应该加上

[!33,=>>P21J/PBC1]

的信息表示。以上所说仅供研究。

 

词 形

剥落

 

[注  ]

392 的底层节点如下

3929  脱离

392a  分裂

392b  分开

相应的 391 底层节点是

3919  参加

391a  合并

391b  会合

另外,请注意 YB2 的转换表示法,对双对象效应句,可提取这一语义块构成知识。

 

词 形

剥蚀

 

[注  ]

< El > 表示以El为中心的要素句蜕

<El J> 表示以 JK 为中心的要素句蜕

 

词 形

补报

 

[注  ]

 [说明23]关于“关怀”

 

词 形

补救

 

[注  ]

第二句类代码的语用特征及其表示方式,希望引起讨论。这里隐含着一个我们未予正式讨论的(Egu+EH)+(EQ+E) E 块构成问题,如这里的“采取措施加以补救”,表示式中Egu 的下标是 guide 的意思。这种构成用于 X31J 的违例格式。所以,这个词的知识表示还远不完备,留作讨论题吧。

 

词 形

不安

 

[注  ]

只取《现汉》的一个义项

 

词 形

不比

 

[注  ]

ljlv 是专门为汉语的“比”和英语的 than 专门引入的特殊符号,《现汉》所给出的意义未取。

 

词 形

采掘

 

[注  ]

  jw53的原底层设计不合理,改为

  jw539     矿物

  jw5399    金属

  jw539a    非金属

 

词 形

参半

 

[注  ]

抽象概念有什么基本特性?五元组、对比、对偶、包含四大项。这些特性不是赋予的,是局部概念联想脉络所固有的。从类人猿到人的进化,也许就是以这些联想脉络的形成为转机。现代认知科学把认知划分为五个层次,最高层次为抽象,次高为“叙述”(narrative),类人猿达到次高水平。那么,从叙述到抽象的突变基因是什么?认知科学列举了世界知识的符号化、范畴化、逻辑化、语言化等等,并认为这些就是教育的核心。这些当然是正确的论断。但是,似乎没有击中要害:从哪里开始突变,并向前发展?突变的起点是上列4项局部联想脉络,随后是语句的全局联想脉络,即基本句类和相应的混合句类。这是HNC的基本假定。上列认知科学所说,是最终的现象归纳,未涉及最高认知突变的本质。人类知识是世界知识的映射,这一唯物主义观点毋庸置疑,但不能简化为“实践认识再实践再认识”的简单公式。大脑中的概念联想脉络是一个复杂的基因结构,其基本特征是具有创造性,淡化或抹杀这一基本特征的认识论提法或论断是不可取的。

世界或社会的进步,归根结底,依赖于这一创造性的发扬和基于这些创造的人类理性活动。劳动与斗争只是社会存在的基本条件,它们可以改变世界,但不能创造世界。社会进步的原动力是大脑的创造性。

君不见某些动物勤于劳动并善于斗争么?然而,这些并不能推动这些动物世界的进步。

HNC的综合和综靠基元概念的划分是以创造性含量为依据的。

创造不是一般的抽象,而是对一般抽象的再抽象。五元组是对词性的再抽象,对比性概念是对近义词的再抽象,对偶性概念是对反义词的再抽象,包含性概念是对层次或上下位概念的再抽象。从再抽象观察一般抽象,就能实现认识上的俯瞰。

现在的节点表便于一般抽象思维,但不便于再抽象思维,容易造成对HNC概念符号体系的误导。体现HNC特征的表达方式也许还需要探索,但重要的是必须行动起来,不能满足于现在的式样。

五元组和中层表示所体现的局部联想脉络,还远未揭示清晰。一个构思巧妙的格式有助于推进这一揭示。年青人知否?我们这一代人在计算尺、手摇计算器和电动计算器上花费了多少最宝贵的光阴啊!突进到微型机时代,我们落伍了。这一年龄悲哀所带来的痛苦你们是难以体会的。但是,事物都有两方性,过分依赖计算机会产生抑制人类创造性不良后果。

词语的映射是一项再抽象的思维过程,不是对词典的翻译,也不是对语料的简单综合。我所写下来的,正确与否(不可能全部正确)并非第一位重要,第一位重要的是我对每一个词语的再抽象模式。这个模式不划分语义语法语用的三角或三层面,而是把三者融为一体。

“参半”一词的映射方式比较典型,希望读者用心一点,为了表达这一希望,写了上面一大堆话。

如果当前的身体状况不生突变,“十月”计划应能如期完成。然而,这个计划只是汉语映射工程粗加工的一半,另外一半和随后的精加工就应该由你们年轻人来接班了。你们的接班工作并非要等到“十月”计划结束以后才开始。词语的映射不是乏味的简单劳动,而是新意盎然的创作过程。因为是创作就不可能一步到位,修改是必然的。

为便于大家工作,收录不全或以前暂缺的高层概念我将争取早日补全。

                               仰山下人

                                2000.8.19

 

词 形

参观

 

[注  ]

    “参观”如果映射成 v9219c31,并非不可,但不如 v9743 传神。如果写出了主体映射符号,但不加 l10 项,又未能给出所示混合句类代码,那就没有达到王国维先生所说的第三境界。这个混合代码意味着,这里的T1B同时也兼当TA的角色,TB2同时也兼当T1C的角色。而且这种“兼当”无主次之分,所以映射符号为 l10,不能随意替换为 l02 或 l03。上一个“注”中说到“词语的映射是一个创作过程”,即指这些语义和语用的精微之处,但是,如果没有句类代码的总体构思,没有HNC所定义语言逻辑组合结构。这些意义是很难表达的。索绪尔先生提出过差异是语言之本的杰出思想,但差异如何表达?动词差异性的本质表现在哪里?索绪尔先生并不明确。Fillmore 先生提出了“格”的概念,给出了几种“格”的示例,“位”及“论元”的概念与“格”类似,都想到了要在主谓宾之间给出语义约束,把大而化之的“主谓宾定状补”框架加上语义包装。然而这种语义包装思路只是王国维先生所说的第二境界。为了寻求格、位、论元的“元素周期表”,大家可不是“为伊消得人憔悴”么!句类-语义块的思路才是第三境界,因为,它摆脱了无限的困境,揭示了无限中的有限“阑珊”。然而,关于第三境界的高度概括论点:“语义块是句类的函数”,是需要大量论文才能阐释透彻的。唐僧从印度取回的佛学经典需要建造一座大雁塔来收藏,从数量而不是从学术意义上来说,句类-语义块所需要的阐释文字也许更多,现在完成的文字,千分之一以下吧!苗传江、晋耀红、张艳红预定的博士论文都是围绕着这个中心论题的。你们都肩负着迈出示范性探索第一步的历史重任。最近,在翻阅“Comprehension”一书的过程中,这一感受是更加强烈了。

 

编号

can-4

 

[注  ]

将《现汉》的义项[1]一分为二,从映射来说,必须如此。义项[2]属于口语未列。

 

词 形

参照

 

[注  ]

这里的映射思索良久,仍觉未透。读者从删改痕迹可以窥见思考过程。

 

词 形

残败

 

[注  ]

用语言逻辑组合结构表述非 v 类概念的关联对象,似乎是第一次。也许今后会经常使用。这里的类别符号是 ug 在前,u 在后,表示它一般不用于 S041J 的 SC。

 

词 形

惨白

 

[注  ]

未取《现汉》义项<1>

 

词 形

苍老

 

[注  ]

未取苍劲义

 

词 形

操切

 

[注  ]

(Eu,H)意思是在E的后面进行修饰

 

词 形

草签

 

[注  ]

(sv212,v845)的意义,读者要仔细领会。

其详细表述也可写成:

(v9238‖(r4005/f30*0)¥(v01‖rc01)

 

词 形

测试

 

[注  ]

测试的语用性非常复杂,这里从El 角度给出了三组示例。

第一组代表

△ 完成了 ×× 的测试(工作)

△ 完成了 对×× 的测试(工作)

格式表示中的变量 k=1,2。

第二组代表

(对)××的测试(工作)已经 00 完成

第三组代表

这些××通过了 00 的测试

××表示测试对象

值得指出的是,Eg  El 句类知识的一致性是扫清语用迷雾的保证。测试的语义也很复杂,但映射符号给出了足够精确的表示,读者应该关注的是其联想脉络的主干。也许将 l10 换成 l02,仅伴随 pw 更有利于语用表述。大家还应该注意:测试必须使用仪器,测试的内容是性能等常识知识这里都没有显示出来,这些都包含在 v9613 与 T19J 的联合句类知识里了。

我建议,将“测试”一词作为句类分析技术玄度测试的样本之一。

看来,语用表达需要建立一些简明的模板,上面给出的表示方式不过是一个粗糙的原型,HNC来者的担子是沉重的。但据我所知,还没有出现比句类、语义块更有效的表示方式。

 

词 形

侧目

 

[注  ]

侧目的映射符号可简化为

  (v7137,v7133)

实际上,这一简化表示才是要点鲜明的方式。上面要点模糊的表示方式只是为了向读者表明HNC符号体现的表达能力。“表情”属于 51a8,是人类局部形态的一部分,这里给出了一个眼睛表情的示例,面部表情可采用类似方式,这是原定的设想。

 

词 形

策反

 

[注  ]

在设计 13a 这个节点的时候,只是基于演绎的概念体现需要,并没有想到策反之类的词。今天碰到这个词,一种理性法官的喜悦之情不禁油然而生。

 

词 形

慈爱

 

[注  ]

关系句的基本句类有一条基本约定,就是RB1与RB2至少有一方显含C,由于含C方处于不定状态,在句类表示式中采取了不予表示的默认方式。但是,也存在RB1与RB2都不含C的情况,这是关系句的亮点。但是,一直没有把这个亮点以明确的方式表达出来。原来以为这样的亮点非常罕见,实际情况并非如此。“慈爱”是又一例,前面已遇到多次,为此,我建议采用现有表示式的最后增加一位“1”的方式来表示这一亮点。这样,上面的句类代码应改写为

  X20R0111×20J

今后,我将按这一新约定办理。

                     仰山下人 2000.8.23.

 

词 形

辞让

 

[注  ]

《现汉》的解释过于简略。

 

编号

ci-9

 

[注  ]

辞岁的习俗已经废除,这里详加表示,不过是表明一下HNC的映射力而已。

 

词 形

辞谢

 

[注  ]

“接受”与“拒绝”的对偶涉及到02,21,46三个基元概念,需要选定其中之一的底层体现这一联想脉络。这里选定了46,分别用

4619        4629

表示与拥有和失去相关的“接受”与“拒绝”。同时,保留“拒绝”作为 v902的三重对偶之一 v9023的特征,保留“接受”作为2189(学习并加以利用)的语义。

 

词 形

刺眼

 

[注  ]

HNC关于感觉的映射定义请参看《理论》p383,这里仍沿用当时的定义。

 

词 形

从容 (cong1,rong2)

 

[注  ]

《现汉》与《辞海》对从容的音调标示不同,这里采用前者。

 

词 形

从事

 

[注  ]

“从事”义项<2>属于民国时代的语言,但现在仍可使用。索绪尔先生引发的关于语言的共时性和历时性之争,应该不是索绪尔先生的本意,而是学界的好事之徒的一种游戏。黄侃先生最厌恶这种游戏,倡导兼容与发展。先父黄焯力主不使用章黄学派的提法,我猜想也是这个意思。HNC恪守兼容与发展的思路,既不全盘继承任何一个学派的主张,也不全盘否定任何一个学派的思路,把研究重点首先放在对语言与思维的全局性模式的思考与建立上。然后在这个基础上考察语言的各种现象。基本句类与混合句类,句类表示式的格式变化,语义块的构成方式与分离,句类的转换与语义块的变换,概念基元的五元组特性,概念节点的高层性(层次性)、中层性(局部联想脉络)和底层性(网络性),是HNC基本理论模式的6个基本侧面。对任何一个词语,我都从这6个方面进行考察,形成“自序”中所说的三项主要内容。

但是,这不是一件以某种规范对号入座的工作,词语的语用个性往往比词语的多义性更为复杂。从这个意义上说,6重模糊的概括并不全面,还应该加上语用性模糊。“从事”这个词在这一点上就非常突出。

va02 是“从事”的精确映射符号,句类表示式及其格式表示

   XJ,  ^(^!0)

语义块构成表示式

       B=YC

       YC:=<!3121EJ>

       [HX]:Ph(j1)

应该说相当准确地表达了“从事”的语义和语法方面,但语用方面则大大不够了。后面的语用示例未必抓住了要点。仍然需要思考的至少有两个问题。

    第一,为什么不按照高层概念的惯例给出“从事”的EQ功能?

第二,分离(约定向后)的[HX]为什么不作S041J的SC来处理?

基于上述,我建议把“从事”列入HNC研究的样板词。结合即将购入的语料,作深入的考察。

我不记得这是第几个指定的样板词了,多年前的这个倡议未能实行,这次决不能再不能议而不行了。这一类有指导的语料研究也就是在理性法官主持下的疑案审理,是我多年的梦想。“理解问答”的6、7可以为证。在“参半”注释中,我谈到我们这落伍一代的痛苦,并非过甚其词。就仰山下人而言,可以说是其晚年唯一的精神痛苦。

请庄老师做好指定样板词的登记和初步考察工作,预致谢意。

 

词 形

粗略

 

[注  ]

粗略是简单与复杂的对立统一,是ju770的精确反映射。粗略又是极为典型和重要的思维方式,可用于8行全部二级节点的属性表示,甚至绝大部分三级节点,特别常用于81,分别用u80,u81标记。

 

词 形

粗浅

 

[注  ]

粗浅是本质与表象的对立统一。这是要点。

 

词 形

催促

 

[注  ]

这里采用了两种第一次使用的表示方式,请研究。

 

词 形

村野

 

[注  ]

pwj2 定义为从事非农业生产(v661)的人们聚居的空间(地点),通称城市。

!pwj2 定义为从事农业生产的人们聚居的空间,通称农村。农村包括村庄和田地,将分别用 !pwj2*1和!pwj2*2来表示,而村野的“野”还包括未耕种的荒野,所以要另加(wj2*5,!v6611)义项。

 

词 形

存放

 

[注  ]

“存放”的对象一般是物,但也可以是“事”和话语,但两块句里的“存放”一定是物。代码[3]表示这一信息。在基本句类的4块句中,B块一定在C块之前,但在混合句类中,C块可在B块之前。与T0a的混合句类是典型情况。

 

词 形

撮合

 

[注  ]

代码[1]表示JK2=RB不含C,JK3=RC:=!31EJ

代码[2]表示RB中含C,C的内容由HNC符号所范定。

 

词 形

插话

 

[注  ]

将这里的vC=>>gw,需要对映射符号作一系列的转换,待规范。

 

词 形

搀兑

 

[注  ]

“搀兑”是语义简明、语用复杂的又一词例,这里给出了四种句类代码。代码Y9022J的JK1往往蜕变成辅块形式,如“这些酒里搀兑了水”,“里”字成了语义块感知的干扰信号。“里”的干扰值得写一篇专文。

 

词 形

抄写

 

[注  ]

抄写与抄录的映射符号应该完全相同,但这里却对“抄写”增加了冗余表示

l01,p

为什么?请思考,这种冗余方式是探索,不是定论。

 

词 形

超群

 

[注  ]

超群的概念符号表示 u,ug 暗含着如下约定:它可以充当S041J的SC,但本身并不具有 uu uv 特征。

 

词 形

撤回

 

[注  ]

汉语的“入出,来去,起止,进退”4对8个汉字都是转移的概念基元,选择哪两对直接进入20的中层,关系到对于转移这一概念的联想脉络基本特征的思考。转移是事物状态的空间序列,从这个意义上说,它与作为事物状态时间序列的过程是并列的,不是过程的子集。另一方面,事物状态的空间序列不可能脱离时间而存在,但事物状态的时间序列可以脱离空间序列而存在,从这个意义上说,转移又是过程的子集,20~23继承10~12的全部属性。

从事物状态的空间序列这一基本特征出发,我们选择了“入出,起止”作为20的直接中层表示,而将“来去”作为20b的中层表示。这三对汉字是20的比较纯净的反映射符号,“进退”则很不纯净了,它既是过程的特征,又是b30的重要特征。

无论观察任何一种形式的竞争(b30),呈现在你面前的态势无非是以下两个侧面:优劣胜败和攻防进退。应该将这两种态势纳入b30的中层表示里。

但当前的节点表只记录了

    b301  

    b302  

这是我“述而不作”造成的许多悲剧之一。

b301 b302的含义远远超出这两个词,胜败只是其中的r,v之一例而已,两个的v还有占优,处于优势,处于劣势,垂死挣扎等,两者的u有势不可挡、(兼v,但不是vu)草木皆兵等,两者的z有胜算,败局等。

b30的另一对中层表示是“进退”。

    b305  

    b306   退

同样,对这一对中层表示的全面考察也要依托五元组。最近我们常用的“抢占”就属于vb305c33,而“退路”就是gb306,对每一个概念节点都要作这样的考察,这才是局部联想脉络的主体。这个工作量是巨大的,然而舍此无其它捷径。

“撤”是vb306的重要反映射符号,但已进入底层,因为它表达了先进而后退的意思,这里采用+v20b0来表示,不采用底层符号。底层符号有限,要尽量节约使用。所谓底层符号,实质上都是另外一些高中层的简化表示,这是再抽象的具体表现,人类大脑奥秘的奥秘就在这里,就在这一再抽象过程的机制,HNC把这一机制命名为语义网络的底层表示,即概念的网络性

“撤”作为b306的底层节点,其意义密切依赖于撤的内容,映射符号列举了军队、外交人员、侨民、谈判人员、投资、建议六项典型情况。这六项活动属于专业活动的政治、军事、外交、经济诸方面。各项内容的具体细节都非常复杂,但是,能否越过某些细节,把相关的语句与HNC定义的特定语境类别联结起来呢?这是理解的关键。HNC是按照这个目标来定位理解的,上面的映射符号(包括句类代码和预期知识清单)是为这一理解目标服务的。这里不来论述这一目标实现的可行性,问题在于:我们,作为科学的探索者,必须朝着这个方向前进,HNC不过是比较具体地设计了一张沿着这个方向前进的蓝图。读者从这个《基本资料手册》可以看到,这张蓝图的草图已经是如此复杂,它的工程实现,需要多少中华民族英才的心血啊!

 

词 形

沉闷

 

[注  ]

义项<1>的类别特征(v,ug)的ug既可修饰 l02,也可修饰 l01,请大家一同注意是否这一特性能否形成一位理性法官。

 

词 形

沉思

 

[注  ]

当采用DJ时,常以逗号形式将DBC分开,如同T3J的“说”,这一语言现象还没有约定表示方式。

 

词 形

称雄

 

[注  ]

《现汉》仅有义项<2>,但无论是古代和现代义项<1>是主要的。义项<1>的现代常用词语是“领先”,句类代码一定是R41104J,但RB2一般是省略的。这些,读者应深入领会。

 

词 形

承受

 

[注  ]

《现汉》的财产权利继承义未录用

 

词 形

赤膊

 

[注  ]

jw6y- 的原设计,作了改动,详见说明。

 

词 形

充满

 

[注  ]

符号[()]/表示该动词作为复合E块构成的配合角色,今后将加强这一表示方式。