当AI写出很好的文章,机器翻译也在日益完善

开国元帅林彪劝老婆少说话,大意是:“如果你说的别人知道,你等于白说;如果你说的别人不知道,你说了也没用。”

我在高中时就有这样的困扰,我时常觉得身边的同龄人说的话都像是某种机械的反应,比如A对B说了某句话或者作出某种举动,B就一定会回应某句话,甚至连表情都大差不离,感觉就像是设计好的台词。如果是这样,说那些话还有什么劲呢?

我们看一些比较老套的影视剧时也会这样的感觉,能猜到某个角色下面会说什么。

我想,类似这样的现象都可以从侧面证明,人的表达有很大的规律性和重复性,你说的每一句话可能都在全世界被不断重复着。而这大概也就是为什么人工智能能模仿人类进行写作。

最近看了一篇文章就提到,知名杂志《纽约客》的作者来到OpenAI的总部,亲自对全能版的人工智能写手进行了测试。他给GPT-2布置的任务是,学会像《纽约客》杂志的记者一样写作。

Open AI的CTO Greg Brockman,用GPT-2的全能版处理了《纽约客》杂志从2007年开始到今天全部的非虚构文章,还让机器阅读了一些20世纪60年代的经典文章。

根据这些数据,GPT-2把《纽约客》的文章特征进行了分门别类,比如记者喜欢用哪些词汇,用什么样的叙事性的修辞,文章行文的节奏什么样,等等。通过这些分析,算法对GPT-2进行了“调准”。

然后,作者让GPT-2写一篇海明威的人物特写。开头,是《纽约客》的真人记者在1950年对海明威的一篇著名访谈。原文是这样的,我翻译过来,给你念一下:

“海明威可能是当时美国最伟大的小说家和短篇作家。他很少来纽约。大部分时间他都在距离哈瓦那9英里外的农场度过,那个农场叫做瞭望山庄。在那生活的除了他和妻子之外,还有9个佣人、52只猫、16只狗、几百只鸽子和3头奶牛。”

这是开头。然后,就交给算法了,让算法以记者的视角,补充下一段。算法是怎么写的呢?我给你念念:

“我(也就是记者)沿着小路向篱笆走去,看见了一只胖乎乎的狗。这只狗在战前经常来瞭望山庄,它现在正沿着小路飞奔到主楼,旁边还站着一头同名的、微小的母牛。院子的地上有一摊红肉汁,海明威就在草坪的椅子上坐着。”

这么一听是不是觉得,这写的也太好了吧?连作者都说,他看到这段的时候,感觉仿佛是自己在写作一样,人工智能的写作能力让他大吃一惊。

如果人工智能能把写作做到这个程度,那么翻译自然也就不在话下了。前段时间审核一个MTPE的稿子,发现机器翻译居然自动把某个品牌名称翻译成其官方中文名称,并且自动在后面加上一个括号,里面放上了英文名称。这个格式简直和细心负责的人工翻译做出来的效果一模一样。

当然,人工智能的算法并不能像人类一样真正“理解”文字,它只是根据海量的数据总结出一些规律,而这个做法则几乎和人工翻译平常所做的如出一辙。

我们人工译员虽然能理解源语言和目标语言,但怎么在两种语言之间进行切换,我们更多地并非在是创造,而只是根据一些即有的规律进行转换而已。

很多人会说,机器翻译永远都不会取代人工翻译。这句话既对也不对。机器翻译只会越来越强,人类对机器翻译的文体也会越来越接受。

但机器翻译能否最终完全取代人工翻译,暂时也看不到这一天。所以目前的机器翻译仍然只是根据规律性的东西进行语言转换,这一点和基础的人工翻译流程一样,只是耗时要少得多。

所以把这种基础的转换交给机器去做,我想不出一个优秀的译员有什么理由不对此感到欢欣鼓舞。当机器翻译把基础性工作做完,人工译员才能花费更多时间进行更有意义的下一步,也就是进一步提升译文水平。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注