继 AlphaGo 之后又一突破：人工智能 Libratus 战胜德州扑克顶级选手

本文作者：周翔

2017-01-31 13:32

导语：由于对方的“底牌信息”是隐藏信息，对于计算机来说，就是在处理一种“非完整信息博弈”。而围棋对弈双方的信息是完整的、对称的，并没有隐藏的信息。

雷锋网消息：当地时间1月30日，在宾夕法尼亚州匹兹堡的Rivers赌场，卡耐基梅隆大学（CMU）开发的人工智能系统Libratus战胜四位德州扑克顶级选手，获得最终胜利。

据官网介绍，此次由4名人类职业玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou对战人工智能程序Libratus，赛程为20天，一共进行了12万手牌的比赛。

2015年，CMU曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中，代表CMU出战的是另外一款人工智能系统“Claudico”，同样也有4名职业扑克玩家参加了比赛，然而，Claudico并未获得最终胜利。

不过CMU学认为，当时扑克职业玩家与Claudico仅进行了8万手牌的比赛，就统计学角度来讲并无法证明人类职业扑克玩家或人工智能具有优势。这也是本轮巡回赛中比赛的牌局数量增加50%的原因。

德州扑克的玩法：每个玩家有2张牌作为“底牌”，同时还有5张公共牌。玩家用自己的2张底牌和5张公共牌结合在一起，选出5张牌，不论手中的牌使用几张（甚至可以不用手中的底牌），凑成最大的成牌，跟其他玩家比大小。按照“Card Ranking”决定最后的胜者。

由于对方的“底牌信息”是隐藏信息，对于计算机来说，就是在处理一种“非完整信息博弈”。而围棋对弈双方的信息是完整的、对称的，并没有隐藏的信息。Libratus此次战胜顶级人类德州扑克选手，具有非常重要的意义。

计算机正确决定，依赖于对方“底牌信息”情况下的概率分布，这种“底牌信息”可以通过对手过去的行为显露出来。比如有时玩家采取“诈唬”（Bluffing），对手有时手里并没有强牌，但还是作出全额下注志在必得的行为，计算机这时要根据对方过去的博弈表现，来判断对手有强牌的概率。

相应的，对手也会推断我方的底牌信息，所以这里就是一个“递归推理”（recursive reasoning），一个玩家无法轻易推理博弈状况。

继围棋和德州扑克之后，人工智能的下一站会是哪个游戏呢？

雷锋网雷锋网

【招聘】雷锋网坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力，翻译及写作能力优良的外翻编辑加入。

简历投递至 wudexin@leiphone.com，工作地北京。

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

4人收藏

周翔

编辑

发私信

当月热门文章