0
雷锋网注:本文作者韩锋,清华大学博士,比特币基金会终生会员,曾任清华大学十五规划重点课题“基于网络(大数据)的创新人才评价和选拔”项目负责人,美国甲骨文教育基金会中国合伙人。
顾学雍教授在清华课程《超越学科的认知基础》中说:“一个范式成功的标志是拥有了自洽的语言系统,包括ontology, structure, orientation.”。
正是在这一理论原则指引下,顾学雍教授向作者韩锋推荐了《区块链新经济蓝图》作者Melanie Swan撰写的一篇论文,讲人工智能和区块链。单纯看这个题目,我很难想象区块链和人工智能有什么关系?
读Melanie Swan这篇文章几遍后,多少觉得从经济学角度来讲有些道理,但是我很困惑作者并没能对“人工智能”这个感念有明确的定义。后来我问了世界级的人工智能专家吴韧,他的回答居然也是:“没有权威的说法。”
我才明白了:人工智能学科的范式还在形成过程中。
根据顾学雍教授的说法,一个笵式,成熟的标志是自洽的语言系统。大家不要小看这个定义,其实非常多的学科没有达到这个标准。而真正的最高水平的人在努力达到这个标准,而且一旦达到,将面临巨大的突破。其实回想一下,爱因斯坦《相对论的意义》,这本书写得太好,其中的很多智慧都有很震撼的感觉。说穿了,牛顿力学到爱因斯坦的时候发展了三百年了,关于时间和空间实际上没有自洽的语言系统,是说不清楚的。实际上人类的思维很懒惰,大部分时候关于时间空间是什么,自己并不清楚。如果让一个人下定义,很大可能会发现那人张口结舌,不知道怎么说。爱因斯坦无外乎就是把这个概念,用他认为合理的语言自洽地描绘出来。描述完发现,如果站在光速不变的原理下,就一定有一个新的自洽语言的系统:那就是相对论。相对论就是超越牛顿力学学科的利用电磁学为其建立了一套自洽的语言系统。
现在我们超越学科的来看一下“人工智能”和“区块链”。
| 什么是“熵”?
之前在清华我们遇到了一位美国的访问学者,Steven Young。我问他什么是人工智能,他的回答是:“三十年人类如果了解大脑以后,我们再回答什么是智能吧!”他的话让我觉得很具有代表性,觉得现在不该定义,理由就是我们现在对大脑没有足够了解。我们知道人类对自己大脑的研究,进展极其缓慢。相应的很奇怪的是,人工智能在飞速发展。所以大家都在等着,要等对大脑有足够了解以后才能定义人工智能。我们认为这实际上是一个巨大的误区:先入为主认为只有生物的大脑才能产生智能,而其他机器计算都是大脑的低劣模仿者!但实际上,我们看了费曼的讲量子计算的那本书讲的麦克斯韦妖以后,得到了巨大的启发,事实并非如此!
为了能理解费曼的思想,我们首先来阐述一下什么是 “熵”?
“熵”为什么是一个成熟的语言系统?上节课我们问大家什么是熵?大家基本上都能把意思说出来,代表系统混乱的程度。大家都不是来自物理系,但是基本上在语言概念上没有错,这就说明熵的语言系统已经很成熟。熵其实是一个很抽象的概念。作者在大学二年级的时候,抱着一本伯克利编的《统计物理学》,学了整整一学期。那本书从物理统计概念和实验的角度一点点剥丝抽茧讲清楚了熵是什么。
作者曾经和曾蓓聊过,她是清华高研院的高材生,曾在MIT读博士,现在在加拿大当教授。我们在讨论问题的时候,是她脱口而出告诉我,熵是是系统无知的度量。作者关于熵也有自己的语言,好多年前,当时一位UBC的朋友请求给她辅导物理化学。结果很快就碰到了熵这个概念,令作者很头疼。因为这位朋友不是物理系的。只好用比较通俗的语言讲:熵是系统能量耗散均分到最大自由度的数量。作者为了让她懂,讲了一个故事:本来,你从银行取了一万块钱,相当于能量。结果你不小心摔了一跤,然后一阵风把一万块钱吹到了街上。而正好街上的一百人就把你的钱一张一百的捡走了,你也只能去报警。而警察也几乎没有可能把你的钱找回来。这说明,一万块钱的“能量”分散到一百人手里,若想自然逆变化回来,几乎不可能,这就是熵增大原理。所以,熵是什么标度?你这一万块钱分散的标度。如果只分散到一两个人,那熵很小,系统的无知程度也小,那你找回来可能大。但是如果你这一万块钱分散到的人越多,熵越大,你找回的可能越小。所以能量分散到原子的自由度的数量,这是用熵来标度的。
后来作者怕讲错,仔细一想,这也是有根据的。你们学过热力学,知道这个公式么?
热力学系统里熵的变化等于它吸收或者放出热量Q除以温度T。这是热力学的一个著名的公式。下方的分母是温度,温度的物理含义是什么?代表平均分子动能,就是均分到每个分子上的动能(能量)。所以热量除以温度,就是系统的能量(对应你从银行取出的一万块钱)被多少原子均分了,熵正好正比于系统中原子的自由度。这就是你的钱丢了,被均分了。
最后给一点物理专业的回答,什么是熵?熵正比于系统可到达量子组态的对数。
前面的k是玻尔兹曼常数,是系统量子组态数。这个公式就比较抽象了,但是后面我们会用到,所以给大家介绍下。总而言之,“熵”这个语言体系是自洽的,说法可以更换,所以可以超越学科的用“熵”的语言描述一下后面的“智能”。
| 什么是麦克斯韦妖?
我们就是要用这么一个成熟的语言体系解释下面我要讲的。什么是麦克斯韦妖。本来我在给顾老师讲什么是麦克斯韦妖,结果顾老师给我推荐,讲这个最好的是费曼的那本讲量子计算的书。后来我回过去看那本书,费曼讲得更好。
给大家讲下什么是麦克斯韦妖。大家都知道熵增大原理,就是热力学第二定律。但是搞电磁学的麦克斯韦自己造了一个概念,给已有的热力学语言体系带来了很大的危机。他就提出了一个小妖(Maxwell’s demon,见图1)。
图1
本来热力学系统达到平衡,两边的温度是一样的,但是中间有个隔断,这个妖有一个控制隔断的开关,麦克斯韦妖让超过某个温度以上的原子可以向右放过,而低于这个速度的原子可以向左放过。而在它掌握下的开关,过一会儿会发生什么现象?动能高的原子都会跑到右边,动能低的就会到左边。我们刚才说了,温度代表系统中原子的平均动能,如果这个妖也算是封闭体系的一部分,那岂不是系统自然的就让热量从温度低的流向温度高的?系统等于不需要外加能量的就成了电冰箱,岂不是把热力学第二定律破坏了?因为根据热力学第二定律封闭系统最终一定要熵最大,这个体系内的温度永远要均衡,能量在各原子自由度上的分布一定要均匀。
别看这么简单一个理想实验,人类探索了一百年。
最终解决这个问题的人是Charles Bennett,他是量子计算机的奠基人之一,来自IBM计算机实验室。我查了他专门讨论这个问题的原始文献。他的这句话很经典:
“From its beginning, the history of the Maxwell’s Demon problem has involved discussions of the role of the Demon’s intelligence, and indeed of how and whether one ought to characterize an ”intelligent being” physically.”(从一开始来说,麦克斯韦妖的讨论包含了妖的智能,关键是怎样物理地把这个“智能”表述出来”)
C.Bennet尝试用物理模型讨论智能,这是自图灵机之后的一大突破。我说过,人类的思想禁区,是只有谈到生物大脑,才敢谈论智能。其他的学科似乎没有资格谈智能。在此之前,只有1950年艾伦.图灵发表了他里程碑式的论文《机器能思考吗?》
其实在Bennett之前,就已经有了铺垫,1961年时也是IBM的Landauer 提出了Landauer原理【7】,甚至更早还有1929年匈牙利的Leo Szilard的单分子热机模型【8】,但是都没有彻底讲清楚。Landauer原理就是:“如果需要不可逆的涂消一个比特的不确定性(系统熵减少,或者说产生一个比特信息),最小需要耗散kT ln2的能量(其中k是玻尔兹曼常数,T是温度)。
解释一下(见图2)。
图2
我们考虑一个热力学的盒子,盒子里只有一个分子,把问题最大程度地简化。一开始我不知道分子是在左边还是右边(图2 a)。你可以定义在左边相当于0,在右边相当于1。在完全不知道的情况下,两个比特的未知,对应的熵应该是kln2。系统未知,你不知道是在左边还是右边。你不知道没有关系,我们假设一个活塞,压这个分子的空间(相当于一个麦克斯韦妖的智能去识别一个原子的速度是否高于某个速度值之上)。如果你们懂热力学那就简单了。如果等温地往左边压,这个系统会怎么样?要释放热量,这是热力学第一定律。
我们相当于当了一回麦克斯韦妖,把两比特的信息的不确定性(原子在左边还是右边)压缩到确定性的左边,熵减少kln2(原来系统有左和右两个选择,假设有两个量子态选择,所以熵是kln2,只压缩到左边系统熵就变为kln1=0),释放多少热量?用热力学的方法很快能计算出来,如果周围的热库温度是T的话,就需要耗散这么kTln2多热量(用公式1)。如果你已经明确知道原子在左边了,没有不确定性了,而你就获得了一个比特的信息。这个模型告诉了我们非常多的信息:第一,什么是麦克斯韦妖的智能?我们认为,因为它能减少熵,能产生信息;第二,Landauer原理也告诉我们,产生一个比特的信息最少需要耗费多少能量?也给出来了,kT·ln2,和系统温度有关。
不过补充一下这个原始的论证是有毛病的。如果盒子内的原子不遵循量子力学,而是牛顿力学,那就得不到后面的结论。你们学过热力学,热力学的基本假设在牛顿力学之上。你看他的论述,第一步时,不知道原子在左边还是右边,如果遵循牛顿力学,原子的运动有确定性,那完全可以假设其在左边,只是你不知道。这样有确定性,不仅是位置的确定性,还有速度的确定性。只要速度是上下的,及可以完全在上下运动,原子永远不会到右边。如果是这样,那进行所谓压缩,另一边是真空,如果压缩的话,不需要做任何功。虽然你不知道,但是确定性就意味着右边没有原子,这是证明的疏漏。
为什么一切要架构在量子非定域上(或者说不确定性上)。这也说明量子力学有了自洽的语言系统多么重要,否则想不到一起。而他的论述完全在牛顿力学之上。有了量子力学做基础,大不一样,这个分子一定能充满到两个,且不说有空间的非定域。有这种最基本的不确定性,△s·△p≥ħ。哪怕说一开始限定的原子就在左边,但是它在速度绝对有不确定性,肯定会往右边跑。所以,只有在量子力学非定域下,Landauer原理的推理才没有漏洞。
有了前几位大师的工作,我们可以定义什么是麦克斯韦妖的智能?这个妖是对系统无知的压缩,也就是熵的减少。根据Landauer原理计算,产生一比特信息至少耗散kT·ln2的能量。
接下来我们就至少给一类分布式智能下个定义:麦克斯韦妖在一个系统中非定域分布,但是执行的是同一个“基础协议”,也就是都在压缩系统的“熵”,这个系统就分布的存在麦克斯韦妖智能。这就意味着智能是可以比较大小的,有的系统产生的智能高,意味着对系统压缩的效率就高了,而且不同系统耗费的能量不一样。有没有系统耗费更少能量产生更多信息?当然存在。
按这个定义,亚当.斯密定义的“市场”看不见的手,就是一个麦克斯韦妖智能系统,比如一个市场很繁荣,商品平均让消费者选择度是五件商品,那每个消费者就是一个麦克斯韦妖,她的一次购买行为就会压缩系统的熵kln5,这就是亚东.斯密市场的基础协议.当然,如果对一个权贵肆虐的市场,进行垄断经营,或者搞计划经济,让消费者每次的选择度只有一,那消费者就失去了熵压缩的功能,整个市场的智能就趋于零,这就是一个贫穷的市场。实际上绝不要小看每个消费者的麦克斯韦妖的作用,成千上万个消费者的购买行为,让这个市场的“基础协议”能给我们带来巨大的繁荣和财富,就比如一百年前的汽车,不外乎牛车上装一发动机方向盘,但是现在的汽车,在市场智能的作用下都快赶上宇宙飞船了。
这样看混沌分形系统也有麦克斯韦妖智能。什么是分形系统?举个最简单的例子,就是康托集。一个线段给你,等分成三部分,挖走中间的部分,然后再把每个小段的中间三分之一挖去,然后再把更小的每段的中间三分之一挖掉,以此类推,不断迭代(见图3)。
图3 康托集
表面上看这些跟智能有些风马牛不相及。可是,我稍微解释一下,这相当于有一个麦克斯韦妖。其实数学上给你一个线段,潜台词的意思就是这些线段上的点每一个出现的概率是一样的。突然挖掉中间三分之一,就跟麦克斯韦妖的熵压缩等同。中间的三分之一概率为0了。然后再次挖掉,再次压缩,相当于执行一个熵减的基础协议。说到这你们认为这能产生智能,多少可能还有些难以理解,我就给你们看下这个图。这叫分型艺术,就是靠我刚才说的基础协议(见图4)。
图4 左边是熵减小的基础协议形成的分形艺术,右边是熵最大,显然左边的图拥有智能的美感。
实际上蜂群给了我们一个分布式麦克斯韦妖的例子。如果把一只蜜蜂和一只熊比较,高下立判,你们肯定会说熊的智能远在蜜蜂之上,因为工蜂只能执行的几个很简单的动作,基本上是反应式的,决不能指望一只小蜜蜂有多高的智能。但是蜜蜂再小,她只要能每一步压缩系统的熵,她就是麦克斯韦妖,一大群蜜蜂,都在执行麦克斯韦妖的协议,会产生什么?(见图5)
图5 左边是熊窝,右边是蜂巢
建筑师们就会说蜂巢是多么的伟大,蜂巢是到现在人类都佩服不已的一种建筑结构,耗费资源最少,和环境最融洽的,也最符合蜂群的组织需求。很多人类的建筑也都在模仿。这就叫群集智慧,分布式麦克斯韦妖的智能。而熊虽然有较高的中心智能,但他筑的巢显然是无法和蜂巢相比的。
再举一个分布式麦克斯韦妖的例子,大家看这个,飞鸟(图6)。
图6 飞鸟的麦克斯韦妖智能系统
大家设想,如果有一个中心智能司令官号召群鸟,可能形成这样吗?基本不可能,这需要极其高级的组织能力和协调能力。每个小鸟的智能都很低,不能假设每只鸟都有飞行员的智力水平。只不过都在执行一个简单的协议,这个协议可能简单到,只要求前后左右的鸟之间的距离保持在某个范围内。就像麦克斯韦妖在康托集中截断线段一样,把距离保持在某个范围之内。就是这么一个简单的协议。但是群集智慧就能体现出很高的协同性,这样一个熵减系统,让人类也叹为观止。
| 比特币和区块链为什么具有麦克斯韦妖的智能?
一个自称中本聪的人2008年希望发明一种完全不依赖中心智能背书的互联网信用货币系统,首先要解决防止重复支付问题,他发现分布式的让每个网上节点充当麦克斯韦妖是避免造假的最好办法,就是给每笔交易盖时间戳,因为时间是最分布的信息,几乎每个人都可以掌握,所以盖上时间戳的交易记录,再作假就很难了。事实上,时间戳是由那些被称之为“矿工”的节点去盖的,就是比特币的挖矿。为什么叫矿工呢?因为你也不能假设网上全是雷锋,平时没事干、不工作,只给你盖时间戳。他们需要奖励。然后就规定,每十分钟,大家把全网的合法交易都记账在这个区块(block)里,然后大家竞争,全球每十分钟只有一个合法的记账人。
什么是合法的记账人?有以下几个条件:第一,他这十分钟里记得账必须经过全网核查,没有问题,就是时间戳盖得对,这是大前提,否则没有奖励。第二,要在全网证明你的算力是全网最高,解SHA256难题,来证明你的算力最高。所以每十分钟只有一个幸运儿能抢到,抢到了记账权就能得到奖励,每十分钟25个比特币。这是一笔很大财富,然后每十分钟一个合法记账的区块又一个一个链接起来,形成一个总账,这就是区块链。所以,比特币的信用就建立在这些全网记账的矿工上,成千上万的矿工就是比特币世界的麦克斯韦妖,靠他们盖时间戳记账,筛除了可能二次支付的虚假交易,不断降低了整个比特币信用系统的熵,最高把比特币的信用推高到一百亿美金,这已经是一个高度智能的系统了。
这本来是一个极客们玩的东西,是开源的协议,就跟我刚才说的小蜜蜂执行的协议一样,大家共同去挖矿来证明每一笔交易的合法性。不管怎么说,运行了六年没有崩溃,这是人类信用史上的奇迹。完全没有任何中心,只依靠基本协议,盖时间戳和记账,每十分钟挖出一个block,形成一个单链,被称为blockchain区块链。这是一个典型的麦克斯韦妖智能系统。
阿里巴巴副总裁高红冰对我说过:“传统金融的信用建立在钢筋水泥的大厦上,你看银行是不是都得盖大楼?但未来的信用是建立在数据的大厦上”。所以区块链就是靠全网分布记账,自由公证,建立了一个共识数据库,这就是未来信用的数据大厦。
为什么区块链可以产生智能?它让全网的计算机算力都能成为麦克斯韦妖,这在人类历史上是前所未有的。每一台计算机,如果参与了区块链的系统,你都会在帮助它压缩信息,全网将来会有智能协议。智能协议的自动执行是依靠全网公证。
对未来畅想,比如说原来你的出生证、房产证、婚姻证等,需要政府备书,好像政府才能承认。但一旦跨国,你就会遇到无穷的麻烦,包括合同。跨国以后合同可能就不能认了,或者无法执行。整个传统的信用执行系统,成本非常高,法院啊、警察啊,而且还有腐败的可能。这些成本都摊在了我们每个人的头上。但是,如果全网公证帮你证明,几乎无法作假。否则就像我刚才说的改时间,除非我有本事把每个人的手表都改了。将来大家公证一个事情,比如公证你们的情侣关系,一下子就会成为全网的事实,修改的话几乎是不可能的了,除非到全网的每个矿工那里去改,成本高到无法接受。现在,要想修改的话,我问过比特币的矿工,如果他们的世界想要这样作假,成本大概是几亿人民币(随着时间还在迅速的增加)。成本一旦高了,大家就都不想作假了,因为付出的代价和获得不成比例。
一个新的时代,未来的信用、真假是靠全网公证某个协议,靠全网每台电脑成为麦克斯韦妖来实现的。这在人类历史上打开了巨大的空间。它解决了什么问题?未来构建全球市场,就像北京市金融局霍学文书记说的:“区块链会成为全球金融的基础架构”,是未来的信用大厦。
雷峰网特约稿件,未经授权禁止转载。详情见转载须知。