扑克与人工智能,历时三十年的战争

2017年5月23至27日,在乌镇围棋峰会上,最新的强化版AlphaGo和世界第一棋手柯洁比试、并配合八段棋手协同作战与对决五位顶尖九段棋手等五场比赛,获取3比零全胜的战绩,团队战与组队战也全胜,让这款由Google公司打造的人工智能再次成为各大媒体讨论的热点。

然而实际上,早在上世纪八十年代,人工智能与扑克的战斗就已经打响。从那时起,扑克的人工智能研究不断深入,而扑克圈也不断从内部与人工智能的战斗中总结经验与数据,作为对扑克技巧战术的参考。

蹒跚学步的人工智能

984年的WSOP(World Series of Poker,世界扑克系列赛)迎来了一位前所未见的选手,它就是由传奇扑克牌手迈克·卡罗(Mike Caro)边写的基础扑克人工智能软件——Orac。虽然在今天人工智能这个词对于我们来说并不陌生,但是在1984年还是一个新颖的词汇。于是,当这个今天看来极为简陋的软件登陆WSOP后,引起了广大参赛选手的好奇与关注。但由于当时的人工智能技术有限,Orac并未取得优异的成绩便被淘汰出局。

不过,人工智能与扑克选手们的较量却从这一天起正式打响。

虽然1984年的战斗结果不佳,科研人员的脚部却未曾停歇。1997年,阿尔伯塔大学发布了扑克人工智能Loki,专攻有限注德州扑克,但表现结果依旧欠佳。原因是人工智能很难在多人游戏中做出最优解,尤其是德州扑克这种极度依赖分析对手心理状态的项目。随后,几乎每年都有无数科技公司发布过德州扑克人工智能,但面对世界顶级扑克选手,依旧难以取得碾压性的优势。

因此,科研人员很快总结出了人工智能在德州扑克这种信息不对称博弈中会出现的五个主要问题:1)信息不够完整,每位选手的底牌都是隐藏的,且具有随机性;2)风险管理,下注策略和由此引发的结果具有不确定性;3)算法,对手的策略没有可参考的数据库,不能进行利用;4)欺骗,德州扑克经常要对其他选手进行欺诈战术,这是目前人工智能的弱项;5)不可靠信息,与第四点相反,由于对手的欺诈战术,导致AI无法准确判断,只能依赖数据库推断最优解。

扑克与人工智能,历时三十年的战争

人工智能,将人类甩在身后

然而最近10年,阿尔伯塔大学、卡内基梅隆大学、奥克兰大学作为扑克人工智能研究发展的中坚力量,使得扑克人工智能的发展发生峰回路转的变化。各大研究机会纷纷改变研发思路——既然暂时无法攻克多人德州扑克,为何不先尝试人数较少的德州扑克比赛呢?

于是在2008年,奥克兰大学的扑克人工智能Polaris在WSOP赛场上,与六位顶尖人类扑克选手进行了一对一的无限注德州扑克比赛,取得了3胜2负1平的成绩——这是当时德州扑克人工智能发展史上,人工智能选手取得的最好成绩。从此时起,扑克人工智能的发展速度可以用迅猛来形容。

受到奥克兰大学的Polaris启发,阿尔伯塔大学于2015年宣布,由他们开发的扑克人工智能Cepheus已经正式攻克单人有限注德州扑克。在数以万计的比赛中,至今未尝败绩。也就是说,在单人有限注德州扑克这个项目中,人类已经被人工智能彻底甩下。而卡内基梅隆大学研发的Claudico在于金东炫(Dong Kim )、杰森·莱斯(Jason Les)等四名扑克牌手单挑中不幸落败,但Claudico并非不堪一击,而是在一些场次中取得了胜利。

随后在2016年,前Google工程师艾瑞克·杰克森开发的德州扑克人工智能Slumbot在WSOP赛场上取得了多场连胜,为艾瑞克大赚一笔奖金。随后,卡耐基梅隆大学宣布由多位博士生研发的人工智能Act-1,数年来不断参加线上扑克网站的比赛,保持了常胜不败的战绩。

而在2017年,一个名为Libartus的人工智能,经过12万场的比赛数据,成功击败了如前文所说的金东炫、杰森·莱斯等知名选手,赢到了价值177万美元的筹码,这是一个非常惊人的结果。之后,连2016年WSOP主赛事冠军斯科特阮(Qui Nguyen)和2017年WSOP主赛事冠军斯科特·布拉姆斯坦(Scott Blumstein),都不幸落败于人工智能。

扑克与人工智能,历时三十年的战争

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://9784qp.com/a/jingyan/shoujidezhoupukeyouxi/2019/0101/262.html