2
本文作者: 刘家欣 | 2016-03-16 11:22 |
刚结束的人机大战上,AlphaGo的表现使得人工智能(AI)成为热门话题。人工智能最终会发展成为新的物种,而人类变成地球的边缘物种吗?还有多久,人工智能将会拥有超越人类的智慧?《Rolling Stone》杂志作者JEFF GOODELL对此问题作了深入探讨,以下是雷锋网对原文的翻译:
「欢迎来到机器人幼儿园」。
Pieter Abbeel 打开机器人研究室的门,进入了这个位于加州大学伯克利分校北部的新建筑。这个实验室显得很凌乱:自行车随意地倚靠在墙角,「学生」们在一个个小隔间内以各种姿势坐着,讲台上的白板写着各种令人费解的公式。Abbeel 是一个精干的 38 岁中年人,典型的美国工科男打扮:牛仔裤,稍大的 T 恤。在 2000 年,他从比利时来美国斯坦福大学读博士,现在是世界著名的机器人学习专家。但首先,他必须教会机器人学生们最基本的「思考」能力。
「这就是我把这里成为幼儿园的原因」,他风趣的说。
然后他向我介绍了 Brett 。这是已破产的硅谷机器人公司 Willow Garage 生产的一个身长六尺(1.8 米)的人形机器人。七年前,实验室购买了 Brett 并长期对其进行试验。Brett 仅仅是实验室机器人中的一员。在另一个小隔间内,一个没有名字的半米长机器人通过绳索挂在椅子上。在地下室内,还有还有一台工业机器人在盒子内日复一日地做着同样的事情,目的是研究机器人的自学能力。穿过一条大街,还坐落着另一个伯克利大学的另一个实验大楼,一个外科手术人形机器人正在试图用「手」把一块肉夹起来。旁边则是一名博士生在试图教会无人机如何围绕一个物件飞行,他对我说:「我们并不希望这些无人机在天上发生交通事故,所以我们正努力赋予他们视觉识别能力」。
在工业领域,执行特定任务的机器人已经不足为奇:把机械手向左移动 6 英尺,抓起模块,向右转动,把模块放到另一平台上。这个动作每小时可以重复 300 次。但这样的机器人并不智能,和割草机其实没有本质区别。但最近几年,机器学习领域有了显著的突破,不断研究出来的新算法已经可以粗略地模仿人类大脑,并有简单的自我学习能力,这使得机器人学习怎么说话和识别图案成为可能。Abbeel 的目标是让机器人成为真正意义上的智慧,不限于特定领域,且可以通过自我学习不断提高。
显然,对于这个目标,他还有很长的路要走。「现在的机器人甚至连两岁小孩的智力都达不到」,他说。例如,Brett 曾经试图学习过一些简单的任务,像叠衣服或打结,对于人类来说,这再简单不过,比如认出在桌子上皱巴巴的一条棉布其实是毛巾,对于机器人来说则困难无比,没有人类灵敏的感官,也没有对于物质的感性认识,最重要的是,它们对于什么是「毛巾」没有概念——它们看到的只是桌子上一团彩色的布而已。
为了解决这个问题,Abbeel 从小孩子学习中得到了灵感,创立了一个自我学习理论,使机器人在学习时,通过不断地试错,从而逼近最终的正确答案。现在,当 Brett 试图叠毛巾时,他的做法和小朋友是类似的:用钳子手把毛巾夹起来,用视觉识别观察毛巾的形状,思考折叠毛巾的步骤。这听起来很蠢,但换个角度,人形机器人已经学会如何自学叠毛巾了。
听起来令人毛骨悚然——一个有自我意识的人造人。而他们的进化速度正越来越快。什么时候他们将超越我们?如果一个机器人可以自己折叠毛巾,终有一天,他可以帮你煮饭,做手术,甚至发动战争?人工智能也许将为人类解决很复杂的问题,如治疗癌症及解决全球气候变暖问题,但同样,他们也有可能担任破坏者的角色,电话推销,监控人类,窃取人类隐私等等。基于此,出现了一个更大的问题:机器人会有一天能够独立思考,表达感情吗?这恐怕没有人能给出确切答案。人工智能在众多科技领域之所以如此特殊,就在于此,机器人对于人类来说,很可能不仅仅是一个「工具」,我们站在新生活的临界点,迎接我们的将会是革命性的科技突破,还是人类生存的巨大威胁,我们不得而知。
管他呢,革命的车轮已经启动。去年夏天,伯克利分校团队在一个类人形机器人上安装了一个短期记忆系统。计算机科学专家 Sergey Levine 是这个项目的负责人,自称这是个奇怪的项目。为了测试机器人的记忆,他们给机器人下了一个命令:让机器人把钉子放到左右两个洞中的一个。然后,他们把机器人的记忆数据清空,让机器人重复放钉子的动作。令他们惊讶的是,机器人竟然准确的放进了之前的洞里。没有了记忆数据,机器人是如何做到的呢?最终,我们明白了,在第二次执行命令时,机器人已经想出了如何用自己的方式执行命令。「这太让人惊讶了」,Levine 说。
Abbeel 把我带到了他的办公室,这是一件没有窗户的小隔间。他在里面告诉我,有一家名叫 DeepMind 的人工智能创业公司在 2014 年被谷歌以 4 亿美元收购(译者注:应为2013年)。几年过去了,DeepMind 研发的人工智能在玩主机游戏方面已经超过了人类。但更令人惊讶的是,他们并没有为特定的游戏编写程序。这和击败象棋冠军的深蓝不同,深蓝仅仅针对国际象棋做了优化。而 DeepMind 的人工智能所知道的,仅仅是要得到尽可能多的得分而已。这里运用到的主要是深度学习的技术,简单来说,当电脑做对了什么,就给他一个「好」 的反馈,电脑通过不断在游戏中试错,最终掌握游戏规则及高分技巧。
这引起了我的好奇心,研究人员在 Abbeel 的实验室里决定尝试一个增量学习算法的试验,希望能够成功的教会机器人跳跃,跑步及游泳。让他玩主机游戏如何?出乎他们的意料,这个名为「信赖域策略优化」的算法玩游戏竟然能媲美 DeepMind 公司的算法。换句话说,信赖域策略优化拥有广泛学习的能力。「我们发现信赖域策略优化算法能够在游戏中击败人类」,Abbeel 说,「不仅仅是教机器人走路」。
Abbeel 放了一段视频。画面的中心是一个机器人模拟装置,在一个开放的框架内。你可以看到一个机器人卧倒在黑白格子地板上。「现在记住,这里采用的是与刚刚视频游戏相同的算法」,他说,机器人被赋予了三个目标:尽可能快地跑动,不要用脚大力地踏地,保持你的躯干在一定高度上。「它不知道什么叫走」,Abbeel 说,「它对于脚和手也没有一个具体的概念,它只有这些目标,并尽可能利用四肢达成这些目标,我们看看它是怎么做的」。
Abbeel 按下了按钮,模仿装置就启动了。机器人在地板上笨拙的挣扎着,让人摸不清头脑。原则上说,它可以决定自己是走路,是跳跃,还是边走边跳。Abbeel 说,但算法的即时学习机制,是机器人会以最合适的方式前进。机器人会分析先前的动作,判断下一步应该做哪个动作,才能使自己拥有更好的前进速度,而这一切会被记录下来,以供以后遇到类似的情况参考。不久后,机器人步履蹒跚,想一个醉汉一样向前进。前进,摔倒,爬起,在走几步,如此循环反复。但渐渐地,它似乎找到了走路的正确方法,甚至开始「跑」这一动作——尽管过程还是跌跌撞撞。当然,机器人并不会理解「跑」是一个怎样的动作。程序里并没有对「跑」下一个准确定义,尽管如此,机器人还是走得越来越快,其速度正如正常人理解的「跑动」一样。机器人终于克服了复杂的平衡难题,灵活地运用四肢进行运动。这使我非常震惊,就像看到一条鱼在 40 秒的时间内进化成人。
「喔,这机器人走路惟妙惟肖的,几乎和真人一模一样」。我惊叹道。
Abbeel 笑了,「几乎」。
除了科幻小说及电影,真正的人工智能可不是流淌着蓝色血液的人造人。他们是算法——即解决具体问题的数学方程(相当于为机器人炒菜准备的食谱)。算法在 21 世纪的重要性相当于 19 世纪的煤:都是各自时代的经济助推器及现代生活的燃料。如果没有算法,你的手机连打电话都不行。Google,Facebook,Amazon等科技巨头没有了算法,就像大厦没有了根基。
Google Deep Mind团队Demis Hassabis
数学算法已经存在了数千年之久,现代的计算机模型也是根据算法创立的。数据输入,电脑黑盒处理,然后算法输出运算结果。当然,现在的科学家们把算法玩出了新花样,试图让计算机自己写代码。假设你想控制直升机的升降,你必须写一个算法给予计算机关于直升机控制的信息(又称输入数据),然后你告诉计算机你打算让直升机如何飞行,以何种角度飞行。接下来,好戏开始,计算机将输出自己的算法,告诉直升机具体的飞行步骤。这就是所谓的机器学习,人工智能背后的重要步骤:如果一个机器可以教会自己控制直升机起降,那么它也能教些别的什么。比如在 Tinder(美国陌陌)上找到真爱,或者在你对 iPhone 说话时识别出你的语音,更甚之,可以创造出终结者里面的天网系统。正如DeepMind 联合创始人 Demis Hassabis所说: 「人工智能就是一门让机器变聪明的科学」。
毫无疑问,我们现在的生活被各种智能设备环绕。当你使用谷歌地图时,算法会根据你的位置及目的地自动绘制行走路线,当你使用谷歌语音,识别你声音的是一种叫做神经网络的算法,这种算法专门用于把声音转换成文字,把环境中的其他声音过滤掉,并理解你的问题 。Facebook 通过不断扫描上传的图片并识别敏感内容,把不允许出现的内容派出在外。
是什么促进了万千智能设备的发展?生命的出现花费了地球 30 亿年的时间,泥浆最终演化成了更高级别的智能。与此相反,计算机在 60 年的时间内疯狂进化,一块硅晶体最终成为一辆能够自动在城市中通勤的汽车,或是可以在一堆人中认出某张脸的机器。在过去的每一个星期中,计算机领域都在产生新的突破:一月,DeepMind 公司的算法机器人击败了欧洲的围棋冠军,围棋是起源于中国的棋类竞技项目,复杂性远高于国际象棋。当然,人类的不懈努力一手推动了世界的不断发展,但我们是否已经到了一个机器人爆发的拐点?我们将创造出一种新的物种(机器人)吗?还要多久,机器人的智慧才会超越人类?
谷歌的未来主义大师 Ray Kurzweil 提出过一个广为人知的「奇点」理论, 认为在未来的某一时刻,硅基生物(计算机)的智力将超越碳基生物(人),生物进化的平衡将被打破。「不远的未来,我们的思考将会交给云计算完成」,几年前的科技会议上,他这么说。他甚至预言了「奇点」到来的准确时间:2045 年。最近一次并不正式的会议中,Tesla 和 SpaceX 创始人埃隆马斯克认为发展人工智能将「召来恶魔」。尽管会议结束时,他告诉我他的言论可能有夸张的成分,他说,「人工智能的快速发展将招致一系列的问题,我们应该重新思考人的位置,并始终将发展人类文明作为第一要务」。正如他所指出的,机器已经渗透到人类生活的方方面面,「我们的生活已经完全电子化,把你的手机关机一天,你就明白我在说什么了」。
通常认为,只有邪恶的强人工智能才能对人类产生威胁,霍金则给予了不同的看法。「真正威胁人类的并非人工智能的邪念,而是他们的能力。一个强人工智能可能足以完美的完成他们的目标,但如果他们的目标与我们的利益并不一致,我们就麻烦了。你也许对于蚂蚁并没有恶意,但如果你管理着一个水利发电站,而一个蚂蚁窝可能破坏发电站的设施,你不得不把蚂蚁窝干掉。将来,我们很可能就扮演者蚂蚁的角色」。
除了我们能够想象的人工智能的用处,未来的强人工智能究竟扮演者什么样的角色,我们还只能从科幻小说中寻找答案。「现在」,Facebook 人工智能研究小组主管 Yann LeCun 说,「人工智能的智商相当于小老鼠」,这话没错,IBM 花了数年时间及数百万美元的经费制造了 Watson ,在 2011 年的一档美国智力竞猜游戏《危险边缘》中,Watson 利用「认知计算」击败了最聪明的人类选手。Watson 可以以每秒 8 亿页的速度阅读资料,并且能够将整个维基百科的数据保存到本地随时参考,甚至能够查阅到数十年前的医疗及法律学术期刊。但他并不能够教会你骑单车,因为他的用处十分狭隘——它对于世界的真正运行规律一无所知。
目前,最为成熟的人工智能程序位于西雅图,但它甚至不能理解「人类呼吸空气」这样的句子。要理解这句话,你需要对世界有一个比较完善的认识,这是目前的人工智能所缺乏的。甚至给这些单词做一个详细的定义,人工智能也不知道呼吸对于人类生存有至关重要的作用,人类呼吸的频率是每分钟一次还是一生呼吸一次。即使是广受好评的 Skype Translator (可以让两个人实时的使用不同的语言进行视频聊天,并显示翻译),距离真正完善还有很长的路要走。
这并不是说,智能机器上位的风险并不存在,《终结者》里出现的天网系统在未来也有可能威胁人类的隐私安全。以攻击型无人机为代表的自动化武器,在未来无疑有可能通过面部识别等技术杀人于无形。但对于人类族群来说,这还算不上什么威胁。就像现在,突然出现一名北朝鲜的黑客开发出无敌算法,赋予金正恩统治世界的能力,这显然属于无稽之谈。在这种语境下,人工智能不像 iPhone ,只需要开发应用程序就可以直接运行。更多的,它接近于创造互联网本身——有些只能靠时间来完成,而带来的益处会随时间递增。斯坦福大学教授,目前就职于百度的吴恩达最近告诉我:「担心人工智能毁灭人类就像担心火星人口过多一样——目前来讲还为时尚早」。
事实上,对机器人威胁的过分夸大,最大的问题在于错误的估计了机器人对于未来的真正影响——底层工人被机器人所代替,面临失业危机,战争中对于自动武器的过分依赖,造成黑客权力过大,这些才是我们需要担心的。人与人之间的关系愈发疏远,人每天与机器沟通的时间甚至超过了人,艺术家被精妙的算法取代,这些都是我们更应该关注的现实问题。而人工智能时代,人类还面临更为严峻的隐私挑战,不仅仅是无人机可能进入你的私宅,大公司权力的空前强大更是我们需要担心的问题。正如科研机构 Institute for Ethics and Emerging Technologies 主管 Marcelo Rinesi 所言,「未来不是机器人统治人类的时代,未来是机器人无所不在,并知道你一切隐私,不断想你推送广告的时代」。
当然,这句话有些偏激,我们应该承认,万物互联的人工智能将给人类带来无穷的福祉。包括 DeepMind 团队的 Demis Hassabis 在内的大多数研究人员相信,如果我们赋予机器以智能,它将会帮助我们解决一些大问题,包括绝症治疗,健康检测等方面,而不仅仅是个保姆,就像科学家们利用计算机解决物理及数学问题一样。微软的 Eric Horvitz 看到了人工智能更重要的意义:「人类的最大困惑,在于人脑自身究竟是如何运作的?做一个类人形机器人对于了解人类自身有重大的意义。只有理解了人类的运行规律,人形机器人才成为可能」。
每一次的技术革命都会引起部分人的恐惧,但恐惧的背后原因各不相同。在工业革命时期,英国的纺织工人暗中破坏织布机,因为他们害怕这台机器将抢了他们的饭碗。(事实却如他们所料)这样荒诞的故事在电气革命时再次重演,很多人相信在家里埋电线会导致精神失常(事实并非如此),因此拒绝接通电线。到了 20 世纪 50 年代,电气厂商甚至担心自家产品被核能产品所取代。
长期以来,人们对于人工智能的夸张想象总是极大地超前于现实科技。 1958 年,世界上第一套神经网络模型「感知器」问世,有关这个模型将模仿及获得人类知觉的新闻见诸报端。随后的 60 年代,人工智能之父 John McCarthy 为五角大楼献上了一份报告,他认为,一套真正可用的人工智能系统需要十年的时间搭建。现在是二十一世纪,我们知道这件事并没有发生,更出人意料的是,关于人工智能的研究在 20 世纪 70 到 80 年代出现了停滞,科学家称之为「人工智能的冬天」。
又一个十年过去了,冬去春来。计算机运算能力的突飞猛进,价格的迅速下降给了人工智能强大的硬件基础。同时,一种名为图形处理芯片(GPU)新型的芯片问世,这种芯片一开始被应用在游戏领域,令人意外的在神经网络领域产生了巨大作用,GPU 可以为神经网络节点的连接提供数百万次每秒的运行速度。
另一项革命性的突破在于大数据。机器的智慧,就像人类的大脑一样,需要一个学习与提升的过程。人类的大脑,除了基因内预设的物件分类以外,后天对于各种物体的感性认识也是很重要的经验。在与猫和狗长期相处并观察后,人类才分清了两者的区别。对于机器学习来说,后天学习的重要性更甚,DeepMind 公司在围棋及游戏领域的突破全靠数千次的练习而得。每次练习,机器对于世界的认识会进一步加深,这就是机器的学校。大量的数据基础,TB 级的数据量,数十年的搜索乃至整个数字世界的数据都在为人工智能的智慧添砖加瓦。
在过去,「创造一个能思考的机器」这件事情,大多是哲学家及计算机科学专家们的学术研究。「与以往最大的不同在于,今日的人工智能真正投入了商业世界运行」,Facebook 人工智能团队 LeCun 这么说。包括Facebook ,IBM,微软公司在内的科技巨头都或多或少在自家产品上运用了这一特性。大公司给了研究人员充足的资金,让人工智能的研究有了足够的商业动机。现在的科技巨头们,都拥有一批精于算法的技术天才及海量的用户数据。谷歌为什么能够建立起一个如此成功的广告平台?精妙的广告投递算法对此功不可没,它给你推送的都是你最有可能点击的广告。对于广告的点击率,每提升 0.5 个百分点,谷歌每年就会多出 5 百亿美金的收入,这也解释了谷歌为何不断致力于提升广告投递算法。而这都以来与机器学习,在这一领域,苹果,微软,谷歌甚至像 Dropbox 这样的云服务提供商都花费了大量的人力及金钱。
另一个竞争激烈的战场是语音识别。语音识别在商业领域的最终目标是,让机器与人的沟通像正常人一样自然,这与强人工智能相比 ,难度大幅降低,而同样拥有重要意义。「语音沟通将成为与触摸屏幕同等重要的交互手段」,吴恩达曾断言。谷歌与苹果公司为了提升个人助手的实用性,一直在大肆收购硅谷的人工智能创业团队,同时,人工智能对于无人驾驶技术也有重要意义,无人驾驶技术在未来的普及无疑会极大地改变城市的形态。不妨试想,一个不需要私车停车场的城市将节省下多少公共空间。「人工智能在近几年成为了最时髦的科技词汇」,旧金山企业家 Jason Calacanis 这么对我说,「最近几个月更甚,几乎所有的硅谷创业者们在对风投讲故事的时候都会把自己的产品与人工智能扯上关系」。
这种对于人工智能被滥用的反感并非全无道理。以人工智能目前的水平,能做的无非是识别图片中的小猫,识别你语音中的关键词而已。但人类的直觉很难用算法表现,视觉识别同理。人工智能在围棋领域的突破并没有太多的实际意义。在人工智能拥有独立思考能力之前,任何对于人工智能统治世界的担忧都是杞人忧天。把人工智能训练的像人类一样拥有直觉及自主学习能力,科学家们还有无数的弯路要走。
「我们突破了一堵墙,我们已经摸清楚了视觉识别的门路」,LeCun 说。「好消息是,我们知道下一步该如何走,而我们相信这确实有用,但当我们以 50 迈的速度在雾中飞奔时,一堵结实的墙可能随时会出现在正前方。当然,目前我们还开心地行驶着」。
48 岁的麻省理工物理学教授 Max Tegmark 留着一头凌乱的蘑菇头,为的是让自己看起来年轻些。在他位于波士顿的两层楼高郊区别墅中,起居室空空如也,只在墙上挂着鸭子和土拨鼠的图片。作为最负盛名的物理学及宇宙学家,Tegmark 性格乖张,不走寻常路线。他的平行宇宙理论广为人知,大意是,存在着无数个永不相交的宇宙,但并非每个宇宙都遵循我们已知的物理学定理。这是对于宇宙模型诸多解释中被广泛接受的一个。但 Tegmark 对于人工智能的狂热程度更高,几年来,他频频发声,提醒人们应该警惕失控的人工智能的可怕。
在刚刚过去的夏季中,我们在他家的餐厅内共进了晚餐,聊了人工智能的未来及他在 Future of Life Institute (生命研究所)的工作。他是这家公司的联合创始人,他形容这家公司是「志愿者经营的研究和宣传组织,致力于减少人工智能的潜在风险」。尽管这家机构拥有霍金这样的名人担任顾问,这家机构主要还是以 Tegmark 的朋友及同事为主,他们每几个月在 Tegmark 的起居室内见一次面。这家机构由 Open Philanthropy Project(开放慈善项目)赞助,马斯克也捐助了 1000 万美金,主要研究如何更好地利用人工智能,以及教育大众科技的好处。我们共进晚餐的几天后,这家机构在纽约时报及华盛顿邮报上发表了一封公开信,警告民众应提防自动化武器的危害。「如果有哪个大国将人工智能用于军事用途,那么,全球的军备竞赛几乎是不可避免的」,信中强调。「自动化武器将成为明天的 AK 47 」。这封信得到了 2 万人的联名,包括霍金,埃隆马斯克,苹果联合创始人斯蒂夫·沃兹尼亚克,诺贝尔奖得主 Frank Wilczek 。
2015 年一月,Tegmark 针对人工智能的潜在威胁召开了第一次重要会议(这与 Tegmark 的物理学,计算机科学博士身份没有太大关系,相反,参加会议的都是哲学家,企业家,科幻小说作家及其他人工智能专业以外,并对于人工智能有担忧的人士)。这个会议在波多黎各举行,为期三天,包括埃隆马斯克在内的各行业精英云集,形式上模仿 1975 年关于重组 DNA 风险的阿希洛马会议,后者对于人工合成及转基因的发展有着重要影响。出席者们主要讨论了人工智能何时会达到或超越人类的智力。以吴恩达等众多人工智能先驱为首的一方认为,这还需要数百年的时间,而马斯克及伯克利大学计算机博士 Stuart Russell 则认为,实际时间远快于人们所预计的。最终,各方预计时间的中位数是 40 年。Tegmark 说。
和霍金的态度相似,Tegmark 并不认为超级人工智能将是邪恶的甚至危险的。「我们必须保证人工智能的利益与我们相一致。如果你拥有一辆无人驾驶汽车,你跟它说,送我去机场吧,越快越好,于是汽车人开始飙车了,你如愿及时赶到了机场,但疯狂的车速及过弯使你吐了一地,你抱怨道,有必要那么快吗?这不是我要的。汽车回复,不是说好的越快越好嘛。
Tegmark 认为现在是思考这个问题的良好时机,毕竟人工智能何时到来,我们并不清楚。有可能要一百年以后,才会有强人工智能的广泛应用,也有可能仅仅花了十年。他举核能为例,想想初次核爆炸时发生了什么,他说,科学家初次接触核能时,也对其潜在的负面影响感到担忧,但如今,世界不是因核能的广泛应用变得更美好了?
无论你去到那,总会有一部摄像机正对着你。他们藏在街角,无人机云台,还有世界上四十亿智能手机上。在 2012 年,FBI 花费了十亿美金,启用了次时代的辨认系统,这是一套识别算法,能够对图像上的人脸,指纹,虹膜等人类体征进行辨认,用于监控数百万的美国人,在律师事务所里强制推行。
但这件事情基本不可能,至少很难高效地执行下去,除非 Yann LeCun 出手帮忙。在人工智能领域, LeCun 就像一个摇滚明星一样受欢迎,在人工智能研究的早期,他与其他二人组成的小组奠定了算法识别图像的基础。LeCun 并不热衷于为 FBI 服务,相反,他是公民隐私权的捍卫者,但这一切无关紧要,技术是中立的,一旦被发明出来,用在哪里就不受科学家们控制了。
最近些天,Lecun 一直呆在 Facebook 位于曼哈顿中心的办公室中。这是个开放型办公室,大约有一个篮球场那么大,有一堵墙上摆着大大小小的监视器。Lecun 的人工智能实验室在办公室的角落里,20 多名研究人员混迹在 Facebook 员工之中。(他的实验室还雇了另外的 25 名研究人员,但分布在硅谷及巴黎)LeCun 在一个长桌子上办公,与团队成员们并肩而坐。如果他把视野望向窗外,他甚至能看到 IBM 开发 Watson 的大楼。
初次见面,Leun 穿着 Polo 衫及牛仔裤,一幅典型的美国教授打扮。他在巴黎长大,但仅仅只有法国口音留下了这段记忆。「我拥有宗教分子所鄙视的一切特质:一个科学家,一个无神论者,典型左派(至少按照美国的标准如此),一个大学教授及一个法国人」。在他的个人网站上,他这么写道。他有三个小孩,每到周末他就会陪着小孩们玩模型飞机。
LeCun 是深度学习的先驱人物,而所谓的深度学习,通常被视为机器学习的更高层次,也是人工智能的重要一步。在 1980 年,他还在读本科时,他便开始研究 1958 年的「感知器」及神经网络,神经网络算法允许机器理解事物,就像人类通过图片及文字了解事物一样。神经网络得名于对人类脑神经结构的模仿,算法通过一个有一个的神经节点,统计分析输入对象(可以是任何东西,包括图像,数字,音频)。
虽然神经网络得名于人类的脑神经,但 Lecun 并不认为神经网络在企图模仿人类的生理构造。「至少这与最新的神经学研究成果无关」,他说,「这仅仅得名与神经的最初概念,如果你想造飞机,你会试图从鸟儿身上获取灵感,即使你不知道小鸟的生理结构,你只需它们是通过扇动翅膀飞行。但造飞机与鸟儿的生理结构就没有太大关系。飞机的创造来源于鸟儿,但对于小鸟细致入微的生理构造解剖与造飞机并无太大帮助」。
在 LeCun 看来,想通过研究人脑内部结构推进人工智能发展的想法简直错的离谱,包括欧洲花费 10 年时间,13 亿美金进行的人类大脑计划,这个计划希望能了解并在超级计算机上模仿人类 860 亿个神经元,100 万亿个神经突触,实现人工智能的飞跃性发展。「他们认为,只要搞清楚了 860 亿个神经元的各自功能,并在一个足够庞大的网络上模拟出来,人工智能就成型了。我想」,他说,「这未免太疯狂了」。
从新泽西州的贝尔实验室辞职后,LeCun 在纽约大学教了十年书。到了 2013 年,马克扎克伯格将其招至麾下,但允许他在纽约大学继续兼职做研究。「 Mark 对我说,Facebook 已经十年了,我们把眼光发到了接下来的二十年当中:未来人们在数字世界的交流会变成什么样呢?LeCun 回答,他一直坚信,未来人工智能将在社交网络中扮演举足轻重的角色,是人与人之间交流的粘合剂。然后有人告诉你,创造一个研究机构来做这件事吧,这确实很难拒绝。
LuCun 并没有透露 Facebook 在人工智能领域究竟投入了多少资金,但通常认为,Facebook 人工智能团队的野心和规模属硅谷之最。我们大多数的人工智能研究集中在理解人们分享的内容上,扎克伯格在自己的主页问答板块这么写道,例如,如果你上传了一张照片,照片中有你的朋友,我们必须确保你的朋友也能看到这张照片。如果你发的是一张狗狗的照片,或是政治言论,我们也应该想办法把对这条消息感兴趣的人联系起来。为了更好地完成这项任务,我们的目标是建立一套人工智能系统,用超越人类直觉的精准度分辨这些消息:图片识别,音频识别等等。一月,扎克伯格宣布,他们在 2016 年的挑战是,建立一个简单的人工智能,用在自己家里,以期更好地帮助他们完成工作。你可以把这套系统看成是钢铁侠的贾维斯,他写道。
LeCun 说,人工智能在 Facebook 广泛应用的绝佳案例是 Moments ,这是 Facebook 旗下的脸部识别应用,可以帮你找到手机里面朋友的照片并允许你发给他们。但不仅如此,弱人工智能在这家公司有着广泛的应用。
除了这些花哨的小玩意儿以外,LeCun 明白,距离真正的强人工智能,现在仅仅走出了微小的一步而已。即使是被认为已有大幅进步的图像识别,仍然面临着诸多问题:人工智能程序对于物体形状,反射,像素级差异过分敏感。但最主要的障碍来自于「无监督学习」。现在,机器学习仍旧依赖于人的大量参与。具体来说,机器需要识别数千张照片,然后人类把这些照片上的物体标记为猫,机器再次见到含有猫的图片时才有可能认出来。还有一种不太常见的方法是「强化式学习」,这种学习方法是给计算机提供一个大致的小猫特征,并通过不断的一张一张照片,告诉电脑哪张是猫片,那张不是。而「无监督学习」与这两者都不同,它不需要一遍又一遍的反馈和输入,而是通过类似于人的直觉,「这是人类学习的方式」,Lecun 说。我们看到物体特征,举一反三,然后将知识放进我们的经验库里,「这是我们必须撬开的一扇铁门」。他说。
如果我给你看一部电影,在播放时突然暂停,然后问你下一秒会发生什么,你大概很容易猜的出来。 LeCun 说。一架飞机即将在空中坠落,你基本不用知道太多理论知识,就能判断接下来的画面,但如果是一个复杂的谋杀案,然后我问你电影里谁才是真正的杀人凶手,影片最后的结局是什么,你大概就得动动脑子了。他说,预测是智慧的本质,我们应该如何做,才能做出一个能够预测电影接下来剧情的计算机呢?不要说预测凶手了,就是理解这个世界是立体的,拥有诸多物理限制,能够预测飞机的坠落,在目前仍旧是一件困难的事情。
所幸,LeCun 找到了一种可能的解决方法, 把所有 facebook 上的内容全部标记为矢量,这意味着计算机仅需保存一个数据点的空间,「我们使用的典型向量相当于一张图片里涵盖 4000 个维度」。他说,「所以,基本上,4000 个数字就可以描述一张图片」。向量可以描述图片,文本甚至用户爱好。每减少一个数字,计算机搜索及存储的压力都会下降一分。如果一个人的兴趣爱好用向量表示,在把向量与图片向量进行比对,找出最匹配的图片,那么这个人很可能会喜欢这张图片。「最主要的,它减少了几何运算量」,他说。
对于那些恐惧人工智能的人,LeCun 认为他们看得太远了。他相信智慧机器将拥有人类的感情及野心是谬论,「人类拥有生存的本能,繁殖的渴望及减轻痛苦的想法,这也是人类大多数邪恶念头的根源。我们没有理由相信机器人会有类似的想法,除非我们刻意这么设计。但他们也许会有同理心,会刚同深受人类的痛苦,因为我们会朝这个方向努力。那么问题来了,我们应该如何设计机器人的底层驱动及行为,让他们可以为我们所用,而不是试图取代我们呢」?
当我走出 Facebook 大楼时,我对于这座挤满各类精英的办公室肃然起敬——这是一个由人与机器共同筑造的帝国。很难想想未来会有什么不同,尽管机器人变得复杂多变是必然的。著名计算机教授兼非虚构作家 Jaron Lanier 说过:「算法是由人类设计及研发出来的,它也反映了创造者们的偏见」。无论好坏,无论对错,我们的未来都会由我们自己创造。套用一句古老的谚语总结:人类,长路迢迢。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。