汉语动词形态困扰的分析与处理

池毓焕



摘 要


    汉语动词本身没有形态变化,表现为两个方面:一是充当动词和非动词时同形,即所谓的“词性兼类”;二是充当不同角色的动词时同形。动词所充当的不同角色包括:一、特征语义块复合构成的一部分,如EQEHqvhv等;二、块扩句类中的EpEr;三、全局语句和局部语句的EgEl;四、复句中并列的EmEn。汉语理解处理通常需要以动词驱动语句分析,动词角色分析是基本前提,因此汉语动词无形态变化成了“汉语动词形态困扰”。本研究着重分析汉语动词形态困扰的表现形式和分布状态,提出模糊消解处理的方法,为汉语理解处理提供相关的理论成果与处理策略。

    汉语理解处理要以字为基础,积字成词成短语,积字词短语成语义块,积语义块成句,积小句成大句成句群,最后成段落篇章。在这个“积”的过程中,汉语动词形态困扰是一大障碍,而困扰的消除也要融入汉语理解处理的全过程中。本文的核心内容是汉语动词形态困扰的消解处理,分成串内和串间两部分展开论述。串内处理包括串联与并联预处理、动词异化预处理、动词团块连见预处理、块扩处理、句蜕处理和复合句处理。串间处理分成两个层次:以语段为基本单位的复句和超越语段范围的句群及段落篇章。其中复句处理扣紧“语串角色决定动词角色”这一主题,除了加强串间检验外,着重利用复句格式在省略和照应的规整性、小句格式趋同性、语义块构成同一性、句类耦合性等特性进行汉语动词形态困扰的进一步消解。句群处理则以领域句类为核心概念,强调领域句类知识比基本句类知识能提供更紧密的语义、语用约束信息。语境单元萃取和语境生成的结果则提供了全新的视野、工具和平台。

本文探讨了语言处理规则的性质,提出无例外规则的可能性,并为不同类型、不同性质的处理规则构建一个规则调度模型,其主要内容包括规则层次论、处理阶段论、目标牵引论、激活与抑制论等。

在方法论方面,现象描述部分重在统计与归纳;消解处理部分既有理论阐释也有演绎和综合;理论探索部分则以哲学思考和理论分析为主。规则的提取基于语言现象的统计描述和语言学的理论阐释相结合,因而是归纳与演绎并举。

 

关键词:  汉语动词形态困扰,HNC理论,复句格式,领域句类,规则调度模型。