格式歧义及其消解和分解

 

 

(武汉  华中师范大学语言学系    430079)

  引言

 

    汉语的歧义问题是大家比较关注的现象,因此也取得了丰硕的成果。比较重要的论著有赵元任(1959)《汉语中的歧义现象》,朱德熙(1980)《汉语句法中的歧义现象》、吕叔湘(1984)《歧义类例》、黄国营(1985)《现代汉语歧义短语》、邵敬敏(1994)《歧义分化方法探讨》,等等,这些文献归纳了大量的歧义现象,而且探讨了这些歧义的分化方法。不过这些研究都是从人的角度去考虑歧义问题,如果从计算机信息处理的角度去考察歧义现象就会有不同的景观。

    歧义现象是普遍存在的,不管采用什么语法体系、不管采取什么排歧策略,在中文信息处理的一定阶段都必须真实地面对,无法回避。所以中文信息处理界对歧义问题一直抱有浓厚的兴趣。从广义上讲,自动分词和自动词性标注就是自动排歧,因为分词和标注都有多种可能,在这些多种可能中选取一个最可能。本文不打算探讨分词和标注中的歧义问题,主要探讨格式歧义。下面选取有代表性的两位,而且是与本文要探讨的格式歧义及其消解和分解有关的两位说明面向计算机的歧义与面向人的歧义有什么差异。[1]