深度 | Nature：我们能打开人工智能的“黑箱”吗？

本文作者：江小片

2016-10-11 15:58

导语：人工智能无处不在。但是在科学家信任人工智能之前，他们首先应该了解这些人工智能机器是如何运作的。

编者按：人工智能无处不在。但是在科学家信任人工智能之前，他们首先应该了解这些人工智能机器是如何运作的，这也就是文中所提到的“黑箱”问题。在控制论中，通常把所不知的区域或系统称为“黑箱”，研究者们通过观察输入和输出之间的联系，尝试对中间的未知领域进行探究。

本文出自 Nature，作者 Davide Castelvecchi，雷锋网编译，未经许可不得转载。

Simon Prades

Dean Pomerleau 还记得自己第一次研究黑箱问题的情景。那是 1991 年，他当时正在做如何命令计算机驾驶的开创性研究，而如今，自动驾驶已经成为了一个非常常见的研究领域。

这就意味着，计算机要用悍马军用汽车专门改装的车轮组装汽车，然后开着这个车穿过马路。Pomerleau 说，他当时还是卡内基梅隆大学的机器人技术研究生。他在悍马里安装了一台编程过的计算机，可以通过摄像机记录的信息解读路况，并储存他对各种路况作出的反应。最后，Pomerleau 希望这台机器能够获得更多关联独立控制驾驶。

在每一次的实验中，Pomerleau 都会运行系统几分钟，然后让汽车自行驾驶，一切都很顺利，直到有一次这辆悍马靠近一座桥时突然向一边急转弯。Pomerleau 赶紧抓住方向盘才得以避免了这场车祸。

回到实验室，Pomerleau 使劲想到底哪出了问题，“我的课题的一部分就是打开黑箱，研究它是如何思考的，”他解释说，但是该怎么做呢？他把电脑编程得能像“神经网络”一样工作，“神经网络”是一种以大脑为模型的人工智能（AI），比基本算法更善于处理复杂的真实世界情况。不幸的是，这样的神经网络和大脑一样也会出错，它们并不会将已经学到的内容存整齐地储在数字存储模块中，而是以一种极难解读的方式将信息散乱地存放着。经过大量测试软件对不同视觉刺激的反应后， Pomerleau 才发现问题所在：神经网络一直把长满草的路边当做向导，因此突然出现的大桥迷惑了它。

二十五年后，破解黑箱问题的难度急剧增加，也更为紧迫。这项技术本身的复杂性和应用也实现了爆发性的增长。现在正在卡内基梅隆大学兼职教授机器人学的 Pomerleau 将他原来的安装在小货车上的系统描述为安装在如今的机器上的大型神经网络的“穷人版本”。而基于大数据集上训练的神经网络的深层学习技术，也已经实现了各类商业应用，从自动驾驶汽车到推荐用户浏览历史网页，不一而足。

它也有望在科学界变得无处不在。深度学习可以帮助未来的无线电天文观测寻找有价值的信号，否则这么大量的数据将无法得到有效的管理；可以理解和消除引力波探测器的最微小的噪声源；也可以帮助出版商筛选和标记数百万的研究论文和书籍。一些研究者认为，配备深度学习的计算机将最终能够表现出想象力和创造力。“你只需要给这种机器输入数据，它就能反馈自然规律给你。”帕萨迪纳的加州理工学院的物理学家 Jean-Roch Vlimant 说。

但这样的进步将会使得黑箱问题变得更尖锐。比如说：机器到底是如何准确找到那些有价值的信号的？谁能确保它是对的？人类能在多大程度上相信深度学习？“我认为我们肯定会输给这些算法。”纽约哥伦比亚大学的机器人学家 Hod Lipson 说。他将这个情况比作是在遭遇某种外星生物的情形：它的眼睛的不仅能感受到红绿蓝这些基色，还能感受到第四种颜色。人类会很难理解这种外星人是如何看世界的，外星人也难以向我们解释清楚。计算机在向我们解释事物上会存在类似的困难，他说：“在某种程度上，这就像是向一只狗解释莎士比亚是谁。”

面对这样的挑战，人工智能研究者给出的回应和 Pomerleau 的回应一样——通过打开黑箱和类似神经科学内的做法来理解网络的内部。答案也可能不对，位于瑞士日内瓦附近的欧洲粒子物理学实验室 CERN 的一位物理学家 Vincenzo Innocente 说，他是人工智能这一领域应用的开拓者，“作为一位科学家，只是将猫和狗分开并不能让我满意。一位科学家应该能够说出区别到底在哪。”

| 探索之路

第一个人工神经网络诞生于 20 世纪 50 年代早期，那时候计算机才差不多刚刚能够执行算法。其背后的思想是模拟“神经元”这一小型计算单元，它们以层级的形式进行排布，通过大量数字“突触”进行连接。底层的每个单元都能接收外部数据（如图像中的像素），然后将其信息分配给下一层中的一些或所有单元。接下来，第二层中的每一个单元就通过一种简单的数学规则整合来自第一层的数据，并将结果传递给第三层、第四层。最后，顶层得出一个答案——比如说，将原始图像归类为“猫”或“狗”。