2006-8-2 8:43:23 | 字号:大 中 小
翻译的前景
随着因特网的出现和发展,机器翻译的应用前景将更为诱人,也会带来更好的商机。但应该提醒的是:今天机译系统的翻译质量还很差。50年来译文质量应该说还未取得实质性的突破,这在世界范围内都如此。机器翻译不但是一个语言处理问题,也可以说是一个知识处理问题。没有点点滴滴的、艰苦的知识和经验的积累,是不可能开发出实用的机译系统的。现在之所以有的开发周期缩短了,一则是因为开发者有长期的经验积累,一则是得到可以共享的资源,而绝不是有什么"绝招"。实际上机器翻译要能真正满足人们的需求,还有很长的路要走。展望下一个世纪,我们做这样的预测,实际上也可以说是我们应该争取的突破点。
(1)源语言分析将是大语境的、基于理解的。如今的分析都是孤立的一个句子一个句子进行的,即单个句子为处理的基本单位。未来的分析将是以句群为单位的。如今的分析求出的是句法关系树,充其量是概念的语义关系图,而不是对文本给出的意思的求解。有人说,简单的都做不到,那么复杂的就更不可能了。其实不然,正是"简单"了,有些问题才变得无法解决的。现在认为"简单"的,几十年前,不是很复杂的吗?
(2)加强基础研究,特别是常识性知识库的建设。有的学者提出建设知识词典,利用它进行基于理解的分析。笔者经过十多年的努力建立的大型知识系统《知网》,今年已上网供研究免费使用。它引起了海内外学者的广泛注意,并已有人在它基础上开始进行新的探索,如上面介绍的基于理解的分析以及新的排除歧义的方法。请读者浏览www.how-net.com
网页。
(3)机译系统将出现高度专业化的趋势。这种系统是为某个特定领域进行调试的,它实际上具备较充分的专业知识,而不仅仅是只有一本专业词典而已。
(4)基础性资源的共享,对于类似于机器翻译这样的研究来说是大趋势。如今我们可以在网上获得许多很宝贵的有关英语的、日语的资源,也有繁体中文的资源。(可惜简体中文的太少了。)因特网提供了一种知识资源共享和知识产权保护的全新的概念和方式。在近两次世界机器翻译高峰会上日本各大计算机公司都介绍了它们如何共享共建机译系统的专业词典的做法,值得我们借鉴。在当今网络时代,陈旧的知识资源保护手段到头来封杀的不是别人而是我们自己。
5)机器翻译系统的高度模块化将有可能带来未来的机译系统的组件化。这样机器翻译系统的研发周期有可能大大缩短。开发者可以把更多的力量放在突出自己的特色上和专门化上。