汉语理解处理中多动词难点的研究与实现

摘 要



    在概念层次网络理论(Hierarchical Network of Concepts简称HNC )体系下,对句子语义分析时碰到的多动词难点,进行研究,并在句类分析系统中实现它。动词构成特征语义块,特征语义块是句子语义分析的中心,多动词处理就是句子语义中心确定的过程。
    研究方法是归纳和演绎并举。从具体实现中归纳出分析需要面对的各种现象,然后通过演绎方法,对各种现象给出处理策略。
首先,在特征语义块构成原则的指导下,对动词进行分类,分为:
1. 需要附加动词的动词,充当EQ、Et,形成EQ+E的结构;
2. 需要附加体词的动词,形成E+EH的结构;
3. 需要附加动词+体词的动词,形成EQ+E+EH的结构;
4. 独立使用的动词。
其次,利用v属性对特征语义块,按照其语义功能进行分类,形成Ep-Er、Eg-El、E1-E2的三种基本的E块配对,并对它们必须具备的条件和存在的难点进行分析研究。
再次,具体设计实现了多动词分析的8个环节:
1. 提出了v属性的概念,对句类知识和词语知识进行高度抽象,总结出可以指导语义分析的22个v属性。
2. 利用v属性,分析特征语义块E的各种语义功能(Ep-Er、Eg-El、E1-E2)所必须的条件和出现的难点,这使得对动词的分类和对E块语义功能的分类更贴近工程。
3. 给出了多动词处理的策略,并对假设检验作了详细的说明。
4. 提出了E作用域的概念,并对每种E(Ep-Er、Eg-El、E1-E2)的作用域给出了定义,作用域可以在语义块内、语串、语串间。
5. 利用作用域的概念,总结了句子内部语串间的关系。
6. 设计实现了Eg-El上下并举的处理策略。
7. 设计实现了E感知规则,控制Eg的假设检验。
8. 设计实现了句类演绎规则,控制非Eg的假设检验。

多动词处理,对汉语的理解处理尤为重要。述语动词的确定是汉语理解处理的重大课题,本文取得了关键性进展。本文也介绍了利用多动词处理技术,开发的一个涉及立场判断的应用系统,这个系统已经应用到一个商用产品中,并已经产品化。