第四讲  知识库建设

        ——知识表示体系

 

1.1     知识库建设的根本原则

(1)      把知识划分为概念、语言和常识三个层面,采取不同的知识表示策略和学习方式,分别建库

(2)      语言知识库建设应将服务目标首先定位于自然语言五重或三重模糊的消解

(3)      词知识库建设应以句类知识为核心

 

1.2     HNC知识库

(1)    基本句类知识库

(2)    概念联想脉络知识库

(3)    汉语非单字词知识库

英语词语知识库

(4)    汉语音节知识库

(5)    汉语单字词知识库

英语特殊词组知识库

汉语特殊词组知识库

(6)    英语语言逻辑概念知识库

(7)    反映射知识库

 

1.3     词语知识库示例

词形: 起诉   音调: qi3,su4   义项数: 1   义项号: 1

概念类别: v,ug

词频及语境: 2  组合代码: 1    句类标记:T3R

插入0  儿化0  轻声0  连读0  着了过100  不没一110

到来出去0000  得成住掉0000  完见开起0000

前后上下0000  给够好乱0000  一下起来00

HNC符号: va5a

句类代码: T3R011*322    句类格式: !113;!320

@S:  TB: pea56  RB2: pe;p

@K:

@CA:  {ug, FKQ  FKH: gw|书;状;}

 

小结:

    HNC知识库是对语法、语义、语用和世界知识的综合抽象与提炼,是自然语言理解处理当前所需要的关键知识。

    HNC知识库以HNC理论为指导,具有提纲挈领式的知识表示体系。

    HNC的知识表示是概念化、数字化(形式化)的,不受语种限制。