1.1   基于HNC理论的机器翻译

 

本文讨论基于HNC理论的机器翻译。HNC理论是一个研究自然语言理解的新理论,由黄曾阳先生创立。HNC理论全面地分析自然语言[6],它面向整个自然语言理解,从概念、词语、语义块到语句、句群和篇章,试图建立一个协调一致的框架和体系[7]。现在,HNC理论已经建立了一套完整一致的概念和范畴,分析和描述语句[8,9]。对于句群和篇章层面的理解,正在进行积极的探索和研究[10,11,12,13]

 HNC理论在语言概念空间研究语言,通过把自然语言映射到语言概念空间,可以透过自然语言的表面现象,研究自然语言的本质;也可以摈弃各种自然语言特有的特征,发现和研究自然语言的共通结构和含义。HNC理论以语义为基础,全面考察自然语言的表层结构和深层语义,并把两者统一起来。因此,HNC理论尤其适合机器翻译[14,15,16,17]

我们将在第二章比较完整地描述语言概念空间的结构,以及从自然语言空间到语言概念空间的映射,这是HNC理论的主要内容。值得指出的是,鉴于自然语言空间是多层次的,我们认为,语言概念空间作为自然语言空间的映射,也应该是多层次的。进一步,我们在语言概念空间中明确地界定了HNC理论中句群概念,句群作为语言概念空间的一个重要层次,对于语言的理解,特别是汉语的理解,十分重要。另外,在第二章,我们还通过比较HNC理论与句法语义理论,说明HNC理论的重要特点。

在第三章,讨论我们的基于HNC理论的机器翻译的几个大的策略,以及HNC理论解决汉英翻译中几个公认难题的方法。在第四章,我们对基于HNC的机器翻译进行一些初步的试验分析。在第五章,讨论一个新的基于HNC理论的EBMT翻译方案。在第六章,给出一个本文的总结。

在附录中,我们描述编写的两个相关的程序,一个用于英汉语料的语句级对齐,还具有检索字符串的功能;另一个程序用于基本作用句的语句格式调整和语义块内部构成变换。