1.1   机器翻译的现状----市场炒作的热潮

 

90年代中期以来,在全世界范围内形成一个研究和开发机器翻译系统的热潮[1] [4,5]。多方面大规模的市场需求促成了这个热潮。一是Internet迅猛发展,形成一个遍布世界的巨大的信息海洋,这些信息涉及人们工作和生活的各个方面;而个人计算机飞速发展和普及,使得人们可以很方便地通过Internet获取分布于世界各地的网络服务器上的各种各样的信息。Internet信息海洋中的信息,绝大多数是以各种自然语言的文本形式存在,而普通用户不可能熟悉很多外语,若想获取在使用外语的网页中的信息,普通用户需要翻译,因而对机器翻译软件也有了需求。二是随着经济全球化时代的到来,公司的产品要销售到世界各地,产品的各种技术文档应该翻译为本地语言。此外,各种国际组织和政府间的文件,也需要用多种语言书写。跨国公司和国际组织看好机器翻译系统的高效率和低成本,对机器翻译很感兴趣。三是由于电子商务的逐步广泛开展,以及使用不同语言的人们交往的不断增多,使得不同国家的人们在经济和社会生活中的交流日益广泛。而语言不通是阻碍使用不同语言的人们交流的一个瓶颈,语言的自动翻译是打破这个瓶颈的一个重要途径,人们对机器翻译寄于厚望。

可以看出,主要是十分旺盛的市场需求促成了现在的机器翻译热潮。许多公司和研究机构加入了研究和开发机器翻译产品的队伍,机器翻译软件受到社会各界的广泛关注。这样,很多与机器翻译相关的产品出现在市场中。这些产品可以归为如下几类,一是传统的文本自动翻译产品;二是网页翻译,它常常与网上搜索引擎捆绑在一起;三是机器辅助翻译产品,如著名的德国TRADOS公司的产品,中国的雅信CAT产品,它主要是帮助专业翻译人员提高翻译效率;四是电子版的双语词典,如著名的金山词霸,它主要是帮助熟悉外语的用户在计算机上阅读外语信息;五是口语自动翻译。

然而,现在的机器翻译的热闹场面不能称为机器翻译历史上的又一次高潮。前两次机器翻译的高潮,以研究和探索机器翻译方法和开发机器翻译系统并重,参加者以研究机构为主体。他们在以前的理论和技术积累的基础上,投入大量精力研究和开发新一代的机器翻译系统。形成对比的是,现在的机器翻译热是强大的市场需求造成的[2],以开发机器翻译类的产品为主,参加者以高科技公司为主。这次机器翻译的热潮距离上一次的高潮只有几年,上一次高潮结束的原因主要是缺乏对自然语言的深入认识,而现在开发机器翻译系统仍然使用以前的语言学理论,其翻译质量肯定没有什么提高[3],还有的产品竟然使用第一代机器翻译系统所使用的词到词的对应方法,其翻译质量就很差了。

所以,正如黄曾阳先生所指出的,现在的机器翻译热主要是由市场炒作造成的。机器翻译的历史表明,现有的机器翻译系统之所以不能令人满意,是因为人们对自然语言的理解认识不够。现有的机器翻译系统基于对语言的表层的句法分析,没有对语言进行深层的语义分析,因此,系统的结果就不会很好。

 

上面的分析表明,如今对机器翻译的市场需求很大,计算机技术也有很大提高,不但个人计算机的性能按照摩尔定律发展,而且超级计算机的性能也在不断提高,另外,Internet网络的飞速发展也对机器翻译有很大的促进作用。所以,机器翻译发展的两个因素都比较理想。若要提高现有机器翻译系统的水平,应该着重考虑决定机器翻译发展的另一个重要因素,即,提高对自然语言理解的认识水平[4]。本文讨论的基于HNC理论的机器翻译,就是研究如何应用HNC理论于机器翻译系统中。HNC理论从深层的语义出发研究自然语言,以它为基础的机器翻译系统的性能,可望比现有的基于表层语法分析的系统,有较大的改进。



[1] 随便挑选一个较好的Internet搜索引擎,输入“machine translation"或“机器翻译”进行搜索,就可以得到很多各种各样的与机器翻译有关的信息,对于当前的机器翻译热由此可知一斑。

[2] 当然,目前仍有一些人从事用于机器翻译的语言学理论的研究,从事机器翻译新方法的探索,他们主要集中在研究机构,在当前的机器翻译从业人员中是少数。然而,这些研究将为更高性能的机器翻译系统奠定基础。

[3] 应该指出,现在的机器翻译类产品有多种多样,我们是说机器翻译的主流产品,即,全文的机器翻译,与过去相比没有多少提高,而其他产品,如电子词典和辅助翻译系统,都做得不错,对用户也有很大的帮助。我们认为,机器翻译的整体水平主要是由全文机器翻译衡量的。

[4] 资深的机器翻译专家冯志伟教授指出,现在的机器翻译系统,只是对语言进行表层分析,如果能够对语言进行深层分析,就可以较大地提高现有系统的水平。