《面向汉英机器翻译的语义块构成变换》


这篇序言 我想说的就是这样一句话:祝福你,又一雪线雄鹰。

这句话里的“祝福”、“又一”、“雪线”和“雄鹰”都有其特定的义境,这需要有所解释。然而 义境这东西的个性色彩一般大于共性,也许读者阅读此书的不同领会都是最好的解释,我何必多此一举呢?但是 所谓序言本来就是做多此一举的事,我也只好随众了。

请允许我从“雪线”说起,这里的雪线是指当前机器翻译准确率的上限,这个上限大约是70%。机器翻译学界完全有理由为这个雪线感到自豪,攀登到这个雪线是自然语言处理的一项奇迹,用行话来说 那既是RBMT(基于规则的机器翻译)的奇迹,也是SBMT(基于统计的机器翻译)的奇迹。但是 广大机器翻译的用户并不买这个奇迹的帐,他们要求机器翻译继续向雪线之上攀登,直到那高山之颠。这是全球化时代对信息产业的一项呼唤,然而目前只是一项隐性的微弱呼唤。信息产业在全球化时代扮演着举足轻重的角色,它面对着日新月异的巨大技术挑战已经忙得不可开交,以致于相关的许多重大科学挑战难免遭受到不同程度的冷遇,这一点西方与东方并没有差别,那个自以为百事领军的美国不仅在机器翻译领域没有显示出任何高明,实际上处于十分落后的状态。上述呼唤表面上是技术需求的呼唤,实质上是一项伟大科学探索的呼唤,它直接关系到自然语言理解之谜和机器翻译之谜的探索。而这两项科学之谜的答案又直接关系到机器翻译的雪线之上的攀登,虽然这段攀登不过是全程的30%,但是登山者都知道这30%意味着什么!

下面该说“雄鹰”了,但实际上只说一个“雄”字,前面提到的RBMT和SBMT都是鹰,但他们不够“雄”,在雪线之上遇到了难以逾越的困难。这一遭遇的必然性大家都心知肚明,因为他们既回避了自然语言理解之谜,也回避了机器翻译之谜。本书之“雄”表现在两个方面,一是它对上述两大科学之谜给出了一个系统而简明的论述,二是它对汉英机器翻译之谜的急所给出了一个击中要害的全面解决方案,后者是第一作者博士论文的基本成果。

上面使用了一个围棋术语——急所,我实在找不到更好的术语来描述本书的学术价值与贡献了。这价值与贡献不仅关系到机器翻译雪线之上的攀登(可简称雪线攀登),也关系到汉语和英语这两种自然语言之间本质差异的比较研究(可简称汉英质异)。从这个意义上来说 本书的书名——《面向汉英机器翻译的语义块构成变换》——有点过于学究气,但它是严谨而谦虚的,这值得称赞。

为什么“语义块构成变换”就是汉英机器翻译的急所呢?要回答这个问题 很不容易。首先是语言术语的障碍,“语义块”、“语义块构成”、“语义块构成变换”是三个具有特定意义的术语,这三个术语你在中外语言学著作里是看不到的,可是 这三个术语正是本书的立足点,也是其创新立说的出发点。

简单地说 “语义块”这个术语或概念是“短语”的扩充,但这一扩充对于雪线攀登和汉英质异的研究不是可有可无,而是绝对必要。英语拥有构造从句和非限定形态动词短语的完备语法手段,而汉语完全不具备这些手段。那么 汉语采用什么语法手段以达到同样的语言表达功能呢?我们是否需要引入一种超越于不同自然语言个性之上的术语或概念以统摄语言分析或语言表达的描述方式呢?本书提供了答案,那就是本书名称的关键词——“语义块构成变换”。

对“语义块构成变换”的进一步描述需要引入“句蜕”与“逻辑组合”这样两个统摄性的术语,与“句蜕”对应的是全局谓语和局部谓语的概念,与“逻辑组合”对应的是并列、偏正、定中、主谓、动宾、动补、介词短语、动词名词化等诸多传统语法概念。语义块构成变换的核心科学问题就是对句蜕和逻辑组合的区分、判定及其交织性的处理,并在这一基础上制定相应的变换原则。那么 本书对这一核心科学问题作出了什么样的贡献和取得了什么程度的成果呢?我愿意把这个事关重大的答案留给读者去思考。

最后 该说到“又一”和“祝福”了。“又一”是因为在本书之前 张克亮教授的《面向机器翻译的汉英句类与句式转换》已经出版,这转换 是汉英机器翻译之谜的大场。大场也是一个围棋术语,同样 我也找不到更好的术语来描述《转换》的学术价值与贡献了。

要赢得围棋的胜利 光有大场与急所的一流功力是不够的,聂卫平先生是围棋大场与急所方面独步天下的顶级高手,然而近年由于收官功力的年龄性衰退而已陷入屡战屡败的窘境。机器翻译的收官之战是一项巨大的语言工程,如果把机器翻译的雪线攀登比作一场400米接力赛,那么 可以明确地说 《转换》与《变换》这两部专著都只是第一棒的主体内容。不过 这第一棒的意义不同于400米接力赛,它不仅具有奠基意义,而且具有对后续三棒的指导意义。至于这一指导作用能否实现,已不是一个纯粹的科学技术问题,更是一个科技指导方针和科技团队组织的问题了。因此 “祝福”就是这篇短序的最佳告别语了。

 

                                                                                                           黄曾阳 2008-6-17