亲属称呼的HNC符号表示

 

(中科院声学所 孙雄勇 北京,100080

 

前段时间一直在做关于单字词的研究,其中牵涉到了称呼的问题,因此在这里我想对称呼的HNC符号表示做一点讨论。

1.以前的表示方法

原来对于称呼的HNC符号表示方式有好几种。表示方式不统一,造成的结果就是在知识库中对于称呼的填写也是风格各异。下面首先介绍一下曾经用过的一些称呼的HNC符号表示方法。

2001.9版的节点表中,血缘关系用4099*yyyy(源流指示+辈分说明+性别指示+父母系指示)表示。

在知识库中有些称呼用了这种表示方法。

例如,爷爷:p4099*1211;f31  1:源;2:辈分差2辈;1:男性;1:父系)。

但是这种表示方法,在父辈一级不能完全区别。父辈一级的表示方法应为:4099*1111

也有用三个标记表示的。

例如:母:p4099*112,f311:源;1:差1辈;2:母系),同理,这样也不能完全表示母亲一级的所有亲属关系。

还有的表示方法是利用各项意义组合成的。

例如,外婆:p4099*122;f31+pj712+gu10bc55

1:源;2:差2辈;2:母系)

pj712:女性

gu10bc55:生命过程下的老

但是也不能很好的表示父辈一级的亲属关系。

2.新版节点表中的变化

在最新的节点表中,表示关系的紧密性的节点已经变化了。新的节点表把它放到了节点403(关系的第三类基本特性)下。其子节点403a表示关系的传递性。节点403a93表示血缘关系。

关于血缘关系在节点表中黄老师没有继续往下写了,黄老师认为:血缘亲戚关系应该是一种重要的社会状态(50b)。正在考虑是否将血缘关系该节点放到社会状态下。

黄老师在《HNC理论的语言学基础》一文中讲到:

40的第五项延伸403属于i表示,具有延伸结构403t=b,表示关系的紧密性4039(如亲疏)、传递性403a(如遗传)和消长性403b(如相生与相克、同化与交融)。

2002.12版的节点表中,血缘关系用4099\kt(源流、辈分、系别的标记),但后面只有kt,而需要表示源流、辈分和系别三个标记。

3.关于称呼表示方式的一点思考

如何来表示亲属关系呢?

我觉得沿用原来的4099*yyyy的形式,这种形式则会比较简单。同辈之间只需要再标记年龄大小就可以区分开来。

因此可以将亲属关系表示为:

403a93*yyyy*c2n

下面对四个“y”进行解释:

第一个“y”:非黑式对偶e2m(m=0,1,2)表示同辈、上辈和下辈,这里可简写只保留m的值,即是y值;

第二个“y”:这里的“y”表示辈分,原来的解释是上辈、同辈和下辈,这样的话,该意思其实是和源流相同的。而只是区分开上辈,下辈和同辈是不够的,父亲和祖父都是上辈,但一个相差一辈,一个相差两辈。因此我认为这里的“y”应该表示辈分相差数比较合适,应是区分相差的辈分数目。

第三个“y”:黑式对偶e2m(m=1,2)表示男性和女性,这里可简写只保留m的值,即是y值;

第四个“y”:黑式对偶e2mm=1,2)表示父系和母系,这里可简写只保留m的值,即是y值;

例如:

父:403a93*1111

伯:403a93*1111*c21

婶:403a93*1121

叔:403a93*1111*c22

对于单字词称呼,我们应该注意下面这一种情况,现在我们平时尊称年龄比我们大的人时,常常在他/她的姓或名后加一个称呼。例如:李姐,靖哥等。而此时,这里的姐或哥并没有血缘或真正的亲属关系,只是代表一种关系的紧密性。这时候是不应该将其放到亲属关系中去的。

 

 


 

 作者简介:孙雄勇,男,湖南邵阳人,1978年生,2001年7月从清华大学中文系计算语言学专业毕业并获得学士学位。2001年9月进入中科院学习。现为中科院声学所博士研究生,指导教师张全研究员。专业:自然语言理解,主要是HNC自然语言处理理论及相关技术研究。Email: xiongyongsun@163.com术。