6
本文作者: 訾竣喆 | 2015-11-13 11:21 |
【编者按】本文编译自medium,原文作者Arik Sosman。
图灵测试一词来源于计算机科学和密码学的先驱艾伦·麦席森·图灵写于1950年的一篇论文《计算机器与智能》。阿兰·麦席森·图灵在1950年设计出这个测试,其内容是,如果电脑能在5分钟内回答出由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。
Facebook最近推出了突破性的AI系统“M”的Beta测试版。据称其性能远远超过了其他任何AI。举个很简单的例子,其他的AI有些可能能够在用户旅行出发前,捉襟见肘的告诉用户当前时间下的多个位置的天气情况(上帝保佑你能够旅途顺利);而M则不然,M能够通过计算预测出你在什么时间会经过什么地方,并以此为据来告知你路程中各个位置的天气情况,并且还能够便捷的根据交通拥堵程度为用户计算出需要在哪个位置进入加油站加油并加以温馨提示,而且还能够为用户推荐目的地附近的食宿和娱乐场所。
有很多人说,M的人工智能是虚假的,背后其实是有人工辅助来完成的。但是,本文的重点并不是去揭露M的背后有真人操控,而是尝试去通过常规的方式来证明这一点。
当我与M交流的时候,它在信息中坚称自己只是AI。然而,M的回复并不是瞬时的,它能够游刃有余地应对完全无限制的极其复杂的测试这一点的确值得可疑。它是否是名副其实的AI便因此成为了人们热议的话题。看起来似乎并没有常规办法能够证明这个事情。
图灵测试其实是一种“模仿游戏”。测试时,测试人与被测试人是分开的,测试人只能通过一些装置(如键盘)来向被测试人问一些问题,随便问什么问题都是可以的。在问完问题之后,如果测试人能够正确地分辨出谁是人谁是机器,那机器就没有通过图灵测试;而相反的,如果测试人没有分出谁是机器谁是人,那这个机器就是具备出色人类智能的机器。目前而言,计算机的智力与人类相比还差得远。
有趣的是,与试图证明M是否是一个名副其实的AI所恰恰相反的是:其他AI都想方设法假装自己是人类,而M则一再强调自己是人工智能。因此,我们将要进行的测试的是:M是否是人类伪装成的AI。而这种测试跟图灵测试相比似乎要更难加以判定,因为人如果想要假装成一个AI的话,似乎与一个AI假装成一个人相比要简单得多。在这种情况下,图灵测试是没有意义的,因为M的目标恰恰是不想通过图灵测试。因此,我们希望证明的不是人工智能的局限性,而是其背后的(所谓的)真·人类智能的无限性。因此,我们所需要的是一个与图灵测试不同的测试——“反图灵”测试。
幸运的是,我最终找到了证明M的本性的方式。但是首先我要说明的是,我想要讲好这个故事,所以在实验之初我是没有定论的。而在进行过程之中,我也一直保持着疑问的态度。直到饰演的最后,我才获得了一个明确的答案——M是有人工辅助的。
在我第一次与M进行交流的时候,我们的谈话是这样开始的:
“我使用的是人工智能,但人们帮助训练我。”这是M的关于其定性的回复。如果我们细细品味这句话的话,就能发现这其中可能意味着许多事情——因为“我使用的是人工智能”和“我是一个完全独立的AI”并不是一个意思。所以我不停地盘问它有关它自己本身的定性问题。
有些人认为,M所指的是,它作为AI其实背后是有人打字输入来进行答复的,但可以帮助他们做到这一点就需要基于机器学习技术。然而,从这段对话来看似乎已经可以证明,直接问M无法再取得任何更多的信息。
M关于其定性的自信是一成不变的。不过,在M所说的话中还是有一些语句明显违背了这个聊天机器人的根本定性。为了测试它的极限,我已经要求它来执行一系列复杂的任务,这是一些其他的AI不可能应对得了的任务。
之后,我告诉了它我工作的地方,然后稍微修改了我的要求。
是的,它真的回应了。
该答复的最值得注意的地方是:“根据谷歌地图显示”,这表明也许,只是也许,一个人正在赶时间键入这条回复。事实上,即使有一些其他的要求,它的回复也已经被证明并不是那样的无懈可击,无法和Siri相比。举例来说,当我跟它说,让它帮我从伯克利分校体育馆找一些漂亮的壁纸来,并且跟它要求这些壁纸要画有夜间的海湾地区,上面最好还要有海湾大桥、泛美金字塔和萨瑟塔时,M虽然确实为我找到了一些非常精美的壁纸,但它说它无法找到任何钟塔。作为安慰,它说如果发现有更加精确的符合我的标准的壁纸将会及时通知我。
现在,随着上述反应的所产生的第一个问题是,它发过来的壁纸确实有泛美金字塔,M知道这些壁纸符合该条件。但这些壁纸所没有的是萨瑟塔,那么为什么M说如果找到有着泛美金字塔的壁纸时会来通知我呢?
第二个问题是,它被称为“Transamerica Pyramid”,而不是“Transamerican Pyramid”。请注意在这张截图中,M的回复里出现了两个“with”,还出现了“I'l”。它已经出现了两个错别字!事实上,这并不是唯一一次出现这种计算机不可能出现的错误。
尽管很多人都不会去区分“its”和“it’s”之间的区别,但这对于AI而言不应该是一个问题。话虽如此,但也有可能它在被训练的时候就已经存在这种语法错误了,所以这些失误并不足以下定论。即使我前面提到的响应延迟的情况可能是故意的,即使当M准备回应的时候出现了输入指示器,而不是作为一个普通的AI所应该做的——立即发送整个字符串。
这个结果并没有满足我,所以我仍然在寻找一种新的方式来证明M的背后的确有真人来辅助。我怎么才能让他们无所遁形呢?
碰巧的是,当答案主动送上门来的时候,我却并没有抓住它。我有一次在Cupertino的电影院看电影,电影结束得比较晚,我问M周围是否有仍在营业中的能够让我吃夜宵的地方。当时只有两个地方还开着门,但我不知道他们的厨房是否仍然有人能够做饭。而在我问M能否给他们打电话来获知到底能不能吃夜宵时,它说,它可以。
于是我便继续追问M能否给我的朋友打电话时,它说无法完成该请求。问它能否可以打电话给我自己时,它还是说无法完成请求。显然,这个功能只能用于呼叫企业,而不是个人。所以,我该怎么办?我想了一会儿,自己编造了一个故事,并要求M拨通这个电话。
于是M问我要电话号码,我干脆地把我的电话号码给了它。大约过了五分钟后,我收到了没有来电显示的电话。当我接通后,听到了电话的另一边有隆隆的噪音,对方说了一句“你好”后就挂断了电话。紧接着,以下的对话就产生了。
不幸的是,我并没有固定电话号码,这让我有点失望。我就这样与可以证明M的性质的机会失之交臂了!
几天后,我因为一些原因不得不在周末回到公司加班工作。而回到办公室后,我才意识到,公司里就有一个固定电话啊。再来试验一遍这个实验!
大约三分钟后,我接到了一个会议室打来的电话。当我拿起手机,一个独特的女性声音说道:“喂?”碰巧的是,我不小心在之前将手机设置为了静音,所以她没听见我说公司名称。尽管如此,这肯定是人类的声音毋庸置疑。我将整个过程做了一个记录。
紧接着,M发送了一个答复。
更重要的是,在我看来,他们似乎忘了屏蔽掉该特定呼叫主叫方的ID,因为我看到了他们拨过来的电话号码。
所以,现在似乎已经可以证明:M会从+1(650)796-2402处调用人工辅助回复。正如大家看到的照片显示,自动反向查找匹配该号码到了Facebook。因此,我们终于完成了实验。我们有明确的证据,证明M背后的确有人工辅助的成分。那么,接下来的问题就是:M是完全由人类来操控的呢,还是说还是有一些人工智能驱动组件在其中的呢?对于这个问题,我想把它作为一个家庭作业,让读者去弄清楚。在此期间,我会充分享受M这个近乎万能的个人助手带给我的乐趣。
相关阅读:
雷峰网原创文章,未经授权禁止转载。详情见转载须知。