52个论题之1:一论中西语言的基本差异
汉语昭昭语义块,西文短语细标明

 

        汉语有明确的语义块指示标记,却没有完善的短语标记,西语恰恰相反。

        因此,汉语的基本特色是:语义块昭然,短语模糊;而西语的特色是:短语昭然,而语义块模糊。汉语有“把、被、向、对……”之类的语义块指示符,西语是不存在的;西语有比较完备的短语指示符,如“the,a,for,with, …”等,汉语没那么完备。

        于是,汉语会经常出现“给他‖一个苹果”之类的语义块分隔模糊,而西语基本不存在;另一方面,西语会经常出现“the cow with crumple horn that Farm Giles likes.”之类的语义块构成模糊,而汉语基本不存在。

        这是中西语言的基本差异之一。因此,汉语计算机处理应从语义块感知入手,而西语应从短语感知入手。

        这一点,可谓天经地义!

        但应该指出:西语在短语感知之后,仍必须上升到语义块感知和句类分析,采取先下后上之策略。而汉语在语义块感知和句类辨识之后,最后仍须回到短语感知,采取先上后下之策略。

        如果置汉语与西语的这一根本差异与不顾,盲目模仿西语的处理模式,在短语类型上呕心沥血,随着句法分析之路亦步亦趋,岂不悲哉!

        基于HNC理论的句类分析之路在绝大多数情况下已经畅通。但仍有一道不容忽视的难关,这就是在两JK之间不存在指示符的“佯谬”现象。这是汉语过于忽视语法造成的佯谬,是必须面对的佯谬。

        这一现象将命名为BC佯谬,对它的处理将命名为BC辨识。

        BC辨识的难度与句类有关,也与格式有关。

        句法分析对此当然一筹莫展,但句类分析应有天成妙策,有待妙手取之。

        在1.0版(注:指“HNC汉语拼音智能输入系统”的1.0版,后同),对BC佯谬不要求全歼,但也绝不可全部放过,策划组应为此制定具体目标与对策。

 

 

★返回“黄曾阳及HNC理论”主页

 

更新日期:1999年8月21日