1.1   机器翻译的不平凡历史

 

       机器翻译具有一个不平凡的历史。黄曾阳先生把机器翻译的研究历程概括为“两次高潮,两次低落和现在的炒作”,非常形象和准确。

下面三个因素决定着机器翻译的发展历程,即计算机的发展水平,人们对自然语言理解的认识水平,以及人们对机器翻译的需求水平。50年代初,电子计算机出现不久,人们便发现它适合于进行机器翻译,因为这种新机器可以存储大量的信息,并且能够方便地对存储和输入的信息进行各种操作;而且,当时美国和苏联对抗,美国需要把大量的俄文技术材料和情报翻译为英文。因此,当时很多大学和公司从事机器翻译的研究和开发。计算机的出现和适量的需求,促成了机器翻译历史上的第一次高潮。

60年代初,这次高潮逐步结束。人们对自然语言认识水平低而导致的机器翻译的结果很差,是结束这次高潮的主要原因。

60年代中期到80年代初,机器翻译处于一个低落期。在这个时期,语言学,特别是计算语言学,获得长足进步,人们对自然语言理解有了较好的认识,在利用计算机处理自然语言方面有了很大进步。同时,那些真正喜爱机器翻译的科学家进行了不懈的探索,并于70年代建造出一些实用的机器翻译系统[2],如美国的SYSTRAN系统,加拿大的TAUM--METEO系统,日本日立公司的ATLAS系统,法国编织研究所的TITUS-IV系统等。这个时期在计算语言学方面的理论积累,和建造实用系统的经验积累,为下一个高潮期的到来奠定了基础。

80年代初,人们预感到信息时代的到来,智能性的信息处理是信息时代所迫切需要的。机器翻译是智能信息处理的一个重要领域,再加上已建成的几个机器翻译系统的鼓舞,机器翻译重新受到各国的重视,许多发达国家相继投入了巨额资金研究和开发机器翻译,形成机器翻译的第二次高潮。欧共体的EURORA计划和DLT系统,日本的Mu系统和ODA计划,以及美国CMU的机器翻译研究等,都是这个时期著名的机器翻译研究项目。广阔的应用前景和前一时期的理论和技术积累是促成这次机器翻译高潮的主要因素。

在这个时期,计算语言学,特别是语言知识的表示机制,有了很大发展。另外,人们开始重视对机器翻译策略的研究,除了传统的基于规则的翻译方法,还研究了基于实例的机器翻译、基于统计的机器翻译等新的机器翻译方法。然而,主要还是由于对自然语言理解的认识不够深入,到90年代初,人们发现,花费了很多人力和财力建造的机器翻译系统,其翻译结果仍然不能令人满意。于是,投资者失望,用户失望,研究开发者失望,机器翻译又进入了一个低落期。