四（第1页）

天才一秒记住【畅想小说网】地址：http://www.cxtra.net

四

banner"

因为“黑箱”

难题，我和莫妮卡关于机器翻译的研究一个学期不到就碰了壁。

起初一切还很顺利。

我们分析了二十世纪的几种商业翻译软件，这些软件的原理大多很简单，连我也能理解。

无非是先将一个句子拆解成一个个词组，再根据辞典把这些词组翻成目标语言，然后根据目标语言的句法规则将词组重新组合，就得到了翻译的结果。

这种方法对于简单的句子尚且可行，但用它翻译一些习语时，总是免不了要闹笑话。

因为目标语言中可能并没有类似的表述。

对此，一些翻译软件开发者想了一些对策，比如说为专有名词、习语和固定的表达方式建立语料库，软件进行翻译时会先检索语料库中是否有匹配的内容。

这样的做法的确让翻译的准确度和流畅性都有所提高，但是，词义消歧仍是一个难题。

特别是当一个词在源语言和目标语言中并不等价的时候，就会引出很多麻烦来。

一个最常被举到的例子是英语的“sheep”

和法语的“mouton”

。

在英语里，“sheep”

指的是绵羊，而法语的“mouton”

不仅可以指“绵羊”

，也可以指“羊肉”

（英语中的mutton），两个词并不等价。

为了检验一个翻译软件是否能有效地消除歧义，我会设计一个包含类似“mouton”

这样的单词的法语句子，让软件生成英语的译文。

那些采用最传统原理的软件几乎只会把“mouton”

翻成“sheep”

，而并不会考虑语义是否恰当。

所以，有开发者设计了一套统计学方法来消除歧义。

比较常见的方法是：先制作两种语言的平行语料库，然后进行统计，从而发现“mouton”

和草地、牧羊犬或羊毛等词一起出现时，一般要翻译成“sheep”

；而与表示吃或烹饪的动词出现在一起时，则要翻译成“mutton”

。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！