让我得意而又略感尴尬的两个事实是:我是一个英语八级生,却对语法知之甚少;我做过几百万字的翻译,而且翻的不错,但我大学时语言学挂过科,直到现在我对语言学也不甚了了。我学英语更多是靠一种叫“语感”的东西,这种东西必须靠背诵和阅读来积累。相反,很多背烂语法书的同学的英语成绩却不如人意。
不管是语法还是语言学,都是专家们对几千年来人类语言规则的总结。这些总结更像是对经验的概括,而非颠扑不破的定理。因为这些总结常常只适用于特定条件,而且会随着人们语言习惯的变化而变化。所以,靠它们来学习语言基本不靠谱。
这跟学游泳、骑车和武术是一个道理,尽管有这样那样的口诀,但大量练习还是必不可少的。电影《黑客帝国》中,计算机能向人脑输入技能,但在目前的科技水平下,那些技能背后纷繁复杂的规则只能通过练习而掌握。
而说到翻译,与传统的笔头翻译不一样,互联网时代的译者们最常使用的工具不是语法,也不是词典,而是搜索引擎。一个特别擅长使用搜索引擎的人,只要英语功底不是太差,一般的翻译都不成问题。使用搜索引擎比词典更加便捷,而且搜索引擎所能找到的语言转换规则和习惯比任何一本语法书和词典都要丰富而细致得多。
下面这篇科技报道中所说的“翻译系统”,既是学习语言的练习者,又是上文提到的“特别擅长使用搜索引擎的人”的升级版。随着这个“翻译系统”的不断练习和无限升级,它最终可能解决文章后几段所说的那些缺陷,并取代人工翻译。
翻译这事儿,Google认为算法和大数据比语言学靠谱(转自Pingwest)
我相信你已经能知道 Google 是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于 Google 总部的 Google Translate 团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。
Google Translate 部门主管 Franz Josef Och 同样也是德国计算机科学家出身,他不但并不精通语言学,甚至并不擅长语言学习。他认为,机翻的关键在对数学、统计和编程方面的擅长。
Google Translate 团队并不会去模仿人工翻译的方式,这就是他们没有去开发字典、定义语法结构和规则的原因。事实上,语法规则对目前的计算机来说仍然难以掌控。Google 更着重于以大数据和统计的方式入手,翻译系统会不断地调整翻译结果的相关性并自我学习如何处理数十亿的文字。通过这种方式,计算机最终能不断优化翻译结果。
以大数据方式做翻译的一个好处是,翻译系统会随着数据的积累而不断地改善。Google Translate 目前已经支持 71 种语言的互译,去年用户的使用次数已经达到 2 亿次。此外,索引全球网页的 Google 还能够依靠互联网上已经存在的翻译内容改善自己的翻译系统。
尽管如此,依赖算法的翻译系统仍然远远无法做到像人工翻译那么精准。句法、语调、歧义都是自动翻译软件很难处理的问题。Google Translate 的翻译结果仍然只能帮助人们对陌生语言进行大致上的理解,有时候得到的翻译结果很难让人通顺地阅读下来。
此外,Google Translate 在不同的语系之间的翻译结果质量也各不相同。例如,英语和西班牙语之间的互译翻译质量良好,英语和日语之间的互译不怎么样,英语和德语之间的互译则非常糟糕。
尽管如此,机翻有一个人工翻译难以做到的优势——它让更多的人接触到了更多的信息。试想一下如果你举着手机就可以与世界上任何语种的任何人交流,那会是多么棒的体验。
知行翻译博客原创,本文地址:http://www.sunyansong.com/rengong-fanyi-jiqi-fanyi/,转载请注明。
人的临场变化,场景应对,这个估计机器人短期还达不到。机器人翻译还成问题。但是如果机器人能有一定的规则,那么文章的翻译我觉得机器人是能够完成的。