更新时间:2020-03-06 18:19:01点击:291
上一篇文章(是谁动了原本属于多人德扑这块奶酪?20年扑克AI发展盘点(上))我们讲到2007年名叫Polaris的人工智能参加双人对决无限注德州扑克,此时的AI虽然已经参与到了人类的游戏,但当时的AI还是比较菜的,是有多个固定程序组成,尚不具备深度能力以及根据对手选择最优解的高级算法的能力…… 即使这样我们仍然不能高兴的太早,因为冰山效应下是隐藏的进一步完善与发展的野心。撼动人类在多人德扑圈霸主的地位正是从2007年开始,人工智能进入了一个新的发展时期。多年来,机器人根本不足以在网上扑克中与人类竞争,但是随着人工智能的改进,机会主义程序员在潜在的利润丰厚的市场中占据一席之地只是时间问题。 近十年AI是如何一步一步撬动了人类的天平,分掉我们都梦寐以求的奶酪的? 2008年—Polaris在非正式测试中击败了六个人 Polaris在博彩生活博览会期间与六名人类玩家竞争,并创下三胜两亏一平的记录。 2008年版本的机器人与其前身相比有了显着的升级,后者在2007年与Phil Laak竞争(但失败了)。 2009年—奥克兰大学推出萨特 奥克兰大学开始研究萨特(德州扑克的相似性评估推理,通过回顾经验)。 Sartre成为AI世界的主要竞争对手,多年来在竞争中处于领先地位。 这是罕见的成功扑克AI之一,并非来自卡内基梅隆大学或阿尔伯塔大学的球队。 你仍然可以在线与萨特竞争。 2011年—扑克网站Full Tilt和PokerStars对Bots的打击 多年来,机器人根本不足以在网上扑克中与人类竞争,但是随着人工智能的改进,机会主义程序员在潜在的利润丰厚的市场中占据一席之地只是时间问题。 大约在2008年,有关谣言的传闻开始在几个扑克网站上传播。 阿尔伯塔大学计算机团队的Darse Billings断言,大多数扑克机器人都非常糟糕,超过90%的人实际上正在赔钱。 这并不能阻止像Shanky Technologies这样的公司公开销售可以在德州扑克和巴解组织竞争的计划。 2011年初,重量级运营商PokerStars和Full Tilt为完全有效地删除机器人做出了巨大努力。 当玩家被识别为机器人时,他们会立即被禁止并且他们的资金被没收。 借助先进的人工识别软件,机器人不再是大多数扑克网站的主要问题。 2014年—Tom Dwan击败限注单挑机,赢得大奖 据称汤姆·道(Tom Dwan)通过击败德州扑克(Texas Hold'Em Heads Up Poker)的极限单挑扑克游戏机获得了巨额资金。 这是由老虎机和视频扑克机制造商IGT设计的。据说机器利用神经网络来学习新策略。 Texas Hold'Em Heads Up Poker的软件由奥斯陆大学的Fredrik Dahl设计。 这台机器后来得到了Phil Hellmuth和Johnny Chan的认可,但从未以普遍的方式流行,至少与传统的老虎机相比。 拉斯维加斯的Bellagio仍然是Hellmuth机器的所在地。 2015年—Cepheus攻下有限德州扑克 经过多年的发展,阿尔伯塔大学最终发布了一款机器人,该机器人在2015年冬季基本上解决了单挑限注德州扑克。 Cepheus通过玩两个月来掌握有限德州扑克。当然Cepheus拥有出色的血统来自一系列着名的机器人,包括Loki,Poki,Vexbot,Hyperborean,Polaris以及其他UoA阵容。 这是扑克AI的一个里程碑,因为有限德州扑克是最大的不完美信息游戏,基本上已经“解决”。 Cepheus在当时被错误地称为“无与伦比”。实际上,Cepheus有时可能会亏本,但不大可能会因大样本而受到打击。 尽管Cepheus对极限德州扑克有着坚定的控制,但无限制版本仍未得到解决,一些科学家认为,由于游戏的不可预测性,未来几年可能会出现这种情况。 Cepheus和其他类似AI的目标是将其用于其他应用,例如通过改进安全策略或谈判策略来帮助政府。或者帮助医生改变患者的治疗方法。 可以访问UoA网站来测试Cepheus。 2015年—Claudico在挑战中输给了人类 不甘向UOA示弱,Tuomas Sandholm和Carnegie Mellon发布他们自己的超级智能扑克A.I. 在2015年夏天命名为Claudico。 Claudico和Cepheus之间的最大区别在于Claudico打无限注德州扑克,这其实很难掌握。 卡内基团队向一群人类职业扑克职业玩家发起了10万美元的挑战,其中包括Doug Polk,Jason Les,Bjorn Li和Dong Kim,他们在Rivers Casino赌场的13天内以每位玩家20,000手的价格与Claudico竞争。 最终人类团队占了上风。他们最终获得了超过Claudico的732,713美元的比喻利润。人工智能以其奇怪的赌注大小而闻名。 Jason Les在赛后告诉PokerListings,他认为AI击败人类只是时间问题。 2017年—阿尔伯塔大学发布DeepStack UoA团队从2017年开始发布声称其新的DeepStack AI是第一个在单挑无限德州扑克中击败职业扑克玩家的AI。 DeepStack是一种新算法,它利用高级和自学游戏的能力,使用类似于着名的AlphaGo AI的深度学习,击败着名的复杂游戏。 DeepStack采用深度神经网络模拟人类直觉并随时随地学习。 该研究包括数十名参与者(尽管没有像Doug Polk或Dong Kim那样出名)和44,000名扑克玩家。前三名表演者也有现金奖励。 DeepStack尤为引人注目,因为它无需专业扑克玩家的培训就能成为一名成功的扑克玩家。 然而,该研究尚未经过同行评审,A团队仍在等待讨论。 Carnegie Mellon的Tuomas Sandholm告诉连线杂志一项研究并未解决这个问题,因为DeepStack扮演的是优秀的球员,而不是像Claudico / Libratus这样伟大的球员。 20017年—Libratus在比赛中碾压人类 2017年1月,Libratus终于可以说是人类与扑克AI竞赛历史上最具决定性的打击。 来自Carnegie Mellon的全新人工智能Libratus不仅击败了人类的对手......它还摧毁了他们。 当最后一手牌在20天,12万手的挑战中被处理时,Libratus上涨了惊人的1,766,250美元。 人类团队由世界上最好的单挑NLHE球员组成,包括Dong Kim,Dan McAulay,Jimmy Chou和Jason Les。 拥有最佳人工智能记录的Kim损失了85,649美元,他承认自己有时会感到有些失望。 他告诉连线杂志说:“我觉得我正在和那些作弊的人玩,就像看到我的牌一样。” “我并没有指责它作弊。那就好了。“ 尽管Libratus在拉丁语中意为“平衡”,但它实际上是Claudico的名义继承者,它实际上是从头开始编写的。 Libratus没有使用固定的内置策略,而是依赖于计算策略的算法。 玩家注意到Libratus每天玩耍的方式发生了明显的变化,这可能与人工智能分析自己的游戏和每天晚上并纠正错误的事实有关。 人类玩家可以获得安慰,因为Libratus由大型匹兹堡超级计算机提供动力,比普通笔记本电脑快约7,250倍。 此外,Libratus纯粹是一个单挑的AI,并且添加一个以上的对手将是一个完全不同(并且更加困难)的任务。 Sandholm希望Libratus背后的技术将拥有许多实际应用。 2019年—Pluribus在六人无限德州扑克打败顶级职业牌手 2019年6月,Libratus背后的研发者曝料他们的最新机器人Pluribus能够在无限德州扑克六人桌打败顶级人类职业牌手。 Pluribus的性能评估涉及两个对抗人类职业牌手的实验。在第一个实验中,五名人类牌手和Pluribus的一个拷贝坐在一桌。这个实验的参与者有Jimmy Chou,Seth Davies,Michael Gagliano,Anthony Gregg,Dong Kim,Jason Les,Linus Loeliger,Daniel McAulay,2012 WSOP主赛事冠军Greg Merson,两副WSOP金手镯得主Nick Petrangelo,Sean Ruane,Trevor Savage和Jacob Toole。 在为期12天的对战中,双方一共打了10000手牌。每个牌手都被分配了一个别名(网名),从而他们能够跟踪对手的游戏倾向,但他们打牌时不知道对手的真实身份。为了激励人类牌手发挥出最佳水准,实验者将根据他们的绩效分配五万美元的奖金。最终Pluribus在对抗中交出了每百手4.8BB的好成绩。 总结 我们不得不承认AI已经发展到可以战胜人类的地步…… 由人类发明却把人类的打败的机器在人类的领域不断的攻城略地……即使AI储存了各种牌局的算法拥有飞速的运算能力,有一点它始终不及人类的是它没有爱与被爱的能力。 李开复在美国科技媒体《连线》网站上发表了一篇文章认为,“在爱与被爱的能力上,人类是独一无二的。爱是人类与人工智能最大的不同。”狭义的人工智能毫不自觉,没有情感,它在击败世界德扑冠军的那一刻,体会不到胜利带来的乐趣,也不会激动到产生要拥抱一位它爱的人的渴望。李开复说,“人工智能不会拥有爱的情感。爱是机器的缺失。” 李开复曾这样描绘人和人工智能共存的蓝图:“人工智能将帮助人类完成多数重复性工作,它所带来的巨大悬殊,则由充满了人性光辉的机会来弥补。” 希望未来的我们与AI和平相处,互利共生!