谷歌大脑是如何炼成的：万字无删减版全解密（一）

本文作者：奕欣

2016-12-16 07:25

导语：这是一个非常少见的故事，尤其是因为它与我们惯常对硅谷的印象相悖。

雷锋网按：如果说到在机器学习领域领先的公司，想必你不会忽略谷歌。从谷歌翻译到从机器视觉，谷歌一直努力将机器学习应用于可能想象的任何地方。本文会讲三个故事，它们在 Google 翻译向 AI 的成功转型中整合在了一起：一个技术故事，一个制度故事和一个关于思想演变的故事。本文源自纽约时报，作者Gideon Lewis-Kraus，雷锋网编译，未经许可不得转载。

序：你=你所读的东西

在十一月初的一个周五晚上，东京大学人机交互教授 Jun Rekimoto 正在电脑前准备演讲。当他在浏览网页时，Rekimoto 突然发现社交媒体的时间流上出现了一些有意思的内容。虽然这些内容很轻易就看出是谷歌机翻的，但质量已经有了很大的提升。在访问了 Google Translate 并进行测试之后，Rekimoto 惊讶不已。虽然已经夜深，但 Google Translate 的进展之快依然让 Rekimoto 久久无法入眠。

随即，Rekimoto 在他的博客中记下了这一发现。首先，他在 Google Translate 上输入了菲茨杰拉德的代表作《了不起的盖茨比》里的一个英文节选段落，点击翻译后，与两个日文版本（一个是 1957 年 Takashi Nozaki 的版本，一个是现代 Haruki Murakami 的译版）进行对比。Rekimoto 在和我沟通的一封邮件中提到，Murakami 的译文带有强烈的个人风格，用语非常细腻。而谷歌翻译的版本虽然还带着机翻的痕迹，但更加通俗易懂。

随后，Rekimoto 通过日译英对 Google Translate 进行测试。他把自己口头翻译的《乞力马扎罗的雪》的开头部分简单地输入进电脑中，发现翻译结果几乎可与海明威的原作媲美。当然，海明威是以行文通俗易懂闻名的，雷锋网也请大家来猜猜，哪一段是 Google Translate 所作，哪段是原版文字呢？

NO. 1:
Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai「Ngaje Ngai,」the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.
NO. 2:
Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called「Ngaje Ngai」in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

即使对于一个美国土著而言，如果不发现 2 号段落的小小瑕疵，其实很难分辨其中的差别。Rekimoto 表示，其实他对 Google Translate 再熟悉不过了：毕竟在 24 小时前，它只是一个会翻出如下文字的机器：

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west,「Ngaje Ngai」in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.

在 Rekimoto 把测试结果发在有着一万多关注者的 Twitter 后，在短短几个小时内，上千人也 po 出了他们「调戏」机器翻译的结果。有些几乎完美，而有的则啼笑皆非。

在东京破晓之时，Google Translate 就在这一夜攀上了日本推特的头条热搜，甚至把 cult 动画和人气偶像少女组合都挤了下去。每个人都在困惑：谷歌翻译怎么会突然这样让我们眼前一亮？

四天之后，全球的上百名记者、企业家和广告商蜂拥到谷歌位于伦敦的办公室中，聆听谷歌的特别发布会。宾客们享受着谷歌翻译 Logo 形状的小饼干，手中拿的是印有不同国家语言的纸张（我的是挪威语），此外还被邀请下载 Google Translate 的软件。桌子上的甜甜圈和冰沙都用小牌子标注出各种国家的风味。过了一会，大家被引到了一个黑暗的小剧场中。

谷歌大脑是如何炼成的：万字无删减版全解密（一）

Sundar Pichai，Google CEO

伦敦市长 Sadiq Khan 首先上台致辞。他以「我有一位朋友」开场，提起对方对他说，市长大人总让他想起谷歌。市长说，「为啥，因为我什么都懂？」朋友否认道，「不是的，是因为你就像谷歌一样，总是试图把我的话补完。」会场传出了善意的笑声。随后，谷歌 CEO 桑达尔•皮查伊上台发表演讲。

皮查伊此行的一项议程是莅临庆祝谷歌伦敦国王大道新大楼的建成。此外，基于他在不少场合都宣告谷歌的未来将以「AI 为先」，这句话引来了不少猜想。在他的演讲中，皮查伊提到了这句话的真实含义：在未来，谷歌的产品不再是传统计算编程的结果，而是「机器学习」。

谷歌大脑——这是谷歌一个鲜少被提及的部门，实际上已经成立了五年时间。这个部门一直遵循着一个原理：人工「神经网络」能够像婴儿一样，通过不断试错来理解世界，而这能让机器拥有像人类一样的灵活性。这条圭臬并不是什么新主张——早在上世纪 40 年代，也就是现代计算机早期阶段就出现了。但少有科学家将这一想法落地，毕竟它看起来太遥远也太神秘了。直到 2011 年，当谷歌大脑计划采用这一方法攻克人工智能，采用机器学习来优化谷歌的移动平台。比如，安卓的语音识别现在已经能媲美人类水平；比如，图像识别也已经在一年前首次运用于消费者产品上。

Google Translate 于 2006 年上线，目前已经成为谷歌最受信赖及流行的应用之一。每天，Google Translate 会面对 5 亿个月度活跃用户的 1400 亿个不同语种的单词。它不仅仅是作为一个独立应用而存在，而且作为 Gmail、Chrome 及许多其它谷歌产品的集成功能，我们将它作为一个按钮——一个毫无障碍、非常自然的电子组成方式。皮查伊在台上提及，直至叙利亚难民危机之时，公司才意识地区间的翻译交流是何等重要。在他背后的屏幕显示，在那段敏感时期，阿拉伯语与德语互译的谷歌翻译请求增长了五倍之多。（这也与皮查伊的想法一致，他在印度出生成长，而雷锋网要指出的一点是，印度是一个多语种国家。）谷歌翻译在此后也已经在稳定增加语种的丰富性，并完善功能，但在过去四年来，质量提升的速度已经大不如前。

直至如今。上个周末，雷锋网也提及了 Google Translate 的大更新，系统已经将大部分请求转换到基于人工智能的系统进行处理。这一更新在美国、欧洲和亚洲都已经上线，包括西班牙语、葡萄牙语、法语、德语、中文、日语、韩语及土耳其语在内的语言，都可以实现与英语的互译。而其它上百种语言也在紧锣密鼓地更新中，以每月预期八个的速度计划在年底前更新完毕。而对于谷歌工程师而言最大的惊喜在于，他们只用了九个月时间就提前完成了。A.I. 系统所取得的进展速度之快，大概就相当于在一夜间掌握了以往技术的总和。

皮查伊对于含蓄的古典文学尤为着迷，一个月前，他曾告诉我，在他山景城的办公室里发表演讲时，PPT 上有些文字还是需要 Google Translate 来辅助显示，毕竟并不是所有人都像物理学家 Robert Oppenheimer 一样能读原版的《博伽梵歌》（雷锋网注：印度圣典，由梵语写就）。因此在伦敦的发布会上，幻灯片上出现了博尔赫斯的经典名言：「Uno no es lo que es por lo que escribe, sino por lo que ha leído.」（评判一个人不应看他所写，而应看他所读。）

带着微笑，皮查伊大声地读着由旧的 Google Translate 展示的令人有些尴尬的直译版本：「One is not what is for what he writes, but for what he has read.」

而在大屏幕的右边，新版的 A.I. 系统版本则展示了一个更加信达雅的译文：「You are not what you write, but what you have read.」

这句话用来描述新版的 Google Translate，却也恰如其分：在某种意义上，Google Translate 的确是第一台通过「饱读诗书」而通晓知识的机器。

谷歌决定围绕 A.I. 而重组公司，实际上是全球机器学习热潮的第一批拥趸。在过去的四年里，谷歌、Facebook、苹果、亚马逊、微软及中国的百度，这六家公司都围绕人工智能展开了一场声势浩大的「人」备竞赛，而大学自然成为了兵家必争之地。企业纷纷向顶尖的学术院系抛出橄榄枝，许以极大的资源和自由。比如硅谷众人皆知 Facebook 惜才如命，CEO 小扎会亲自通过视频和电话来了解公司即将纳入麾下的优秀研究生，七位数的年薪起跳根本不在话下。而参加人工智能的相关学术会议的人士几乎增加了四倍。科技巨头们在关心的，不仅仅是小打小闹的技术进步，而是如何掌控接下来即将来临的计算平台：普适性极强、无处不在的人工智能。

「人工智能」这个词似乎总是出现得这么理所当然，但实际上它一直是引起混乱和争议的源头。想象你正置身上个世纪 70 年代，在路上拦住了随便什么人，掏出了一个智能手机并向她展示里面的 Google 地图。如果你尝试说服她，你不是什么奇怪巫师，而你拿出的「黑色护身符」也只是一个比阿波罗时光机更为强大的微型电脑，谷歌地图实际上毫无疑问，就是一个能向她展示什么是「人工智能」的东西。的确如此，这个应用能够为你制定更棒的路线，比如从酒店到机场——显然，机器能比你做得更快更好，此外，它还能对交通进行评判，规划最佳路线，并当你「误入歧途」时，重新判断你的位置并推荐新的路线。

实际上，今天没有人会把谷歌地图与「高贵的」人工智能相提并论。当我们在使用智能这个词的时候，是带着情感色彩的。我们所理解的人工智能，是能与其它初级简单的事物所能完成的东西不同的。现在，我们能用自动化完成一项任务，那么所涉及的相关技能就会降级为一种单纯的机制。而今天的谷歌地图，似乎还不能对应上我们所想象的「人工智能」这个词，而只能充其量叫作「机器」（robotic）：只接受一个明确的请求（从某处到另一处），并尽力满足这个需求。因此，人工智能这个词所能对应的实际工作已经在缩小。

皮查伊将目前的人工智能应用与「通用人工智能」这个终极 boss 区分开来。后者不会涉及具体的指令，而将是一个通用工具，为一般情况下的一般用途而设计。皮查伊认为，公司未来的运转将主要依赖通用人工智能。想象一下，如果你告诉谷歌地图，「我要去机场，但我中途要停下来为我侄子买个礼物，」一个通用版本的人工智能服务——就像三年前的电影《Her》中，斯嘉丽•约翰逊所配音的那个无所不在的助手一样。她能够像你的亲密朋友一样，知道你的一些基本情况：侄子的年龄、喜欢给孩子买什么、哪能找到一个购物商店。但一个真正智能的地图也能做一些亲密朋友所考虑不到的事情，比如你侄子的学校里，孩子们最近最时髦玩些什么。一个智能的机器能够通过错综复杂的数据抽丝剥茧，并寻找出那些甚至我们自己都浑然不知的需求。

人工智能的新浪潮，也就是 AI 助手——就像苹果的 Siri、Facebook 的 M 及亚马逊的 Echo，都是机器学习的产物，作用大同小异。这些公司在消费者身上做着机器学习之梦，但是机器学习并不一定只局限在消费者身上。三星的医学影像子公司今年宣布，其新款的超声设备能够检测乳腺癌，而管理层也在努力增加人员贮备，以扩大计算机的行业应用。DeepMind 在 2014 年被谷歌纳入麾下，虽然当时的预测显示，人工智能在十年后才能战胜人类，但 3 月份，AlphaGo 就以 4：1 战胜了围棋大师李世石。

1950 年，艾伦•图灵提出的测试指出，计算机如果能在五分钟的文本交流中成功欺骗一个人类对话者，那么就算测试成功。是否机器能在两种语言中自由切换，并能很好地理解人类的语言进行对话？谷歌大脑的成员们正在推动和帮助监督 Translate 项目，满怀信心地相信这样的机器能够成为未来的一位通用人工智能助手。

接下来雷锋网要展示的，就是 Google 的研究人员和工程师们（刚开始只有一两个人，后来变成三四个，最后成长到了上百个）沿着这一方向取得巨大进步的故事了。这是一个非常少见的故事，尤其是因为它与我们惯常对硅谷的印象相悖。这个故事里面，没有那种在车库里捣鼓一些东西，认为自己可以改变世界的人。它不是一个关于科技解决所有问题的故事，也不是一个关于技术会导致世界毁灭的故事。它也与颠覆无关，至少不是我们通常认为的那种颠覆。

事实上，里面有三个重叠的故事，它们在 Google 翻译向 AI 的成功转型中整合在了一起：一个技术故事，一个制度故事和一个关于思想演变的故事。

技术故事与一个公司专注于一个产品的团队有关，在这里他们只用了别人四分之一的时间，对一个旧产品进行了改进和测试，并形成了全新的版本。
制度故事与公司内一个小而有影响力的人工智能团队有关，他们对一些古老、未经证实和广泛不适用的计算概念出于直觉的信念，颠覆了几乎每一家公司。
思想的故事与一些长期坚持不懈的认知科学家、心理学家和工程师有关，他们看似不合理的信念，最终激起了我们对技术以及意识本身理解上的范式的转变。

第一个故事是 Google Translate 的故事，它发生在山景城的九个月时间里，解释了机器翻译的转变。第二个故事是谷歌大脑的故事。第三个故事是深度学习的故事，它发生在苏格兰、瑞士、日本、加拿大等地遥远的实验室，时间跨度七十多年，它甚至改变了我们对那个会思考的自我的认知。

这三个故事都与人工智能有关。七十年的故事与我们对人工智能的期待与渴望有关，二十五年的故事与它在近期可以做什么有关，而那个九个月的故事则与它现在能做什么有关。这三个故事都是对概念的验证，而所有的一切都只是开始。

以上是全文第一部分，敬请期待雷锋网的后续文章。

via NewYork Times

【招聘】雷锋网坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力，翻译及写作能力优良的外翻编辑加入。

简历投递至 wudexin@leiphone.com，工作地北京。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。