GG扑克

GG扑克-GGpoker
wsop系列赛最新资讯福利下载平台
GG扑克官网-GG扑克(ggpoker)安卓苹果官方下载 wsop系列赛指定

GG扑克官方下载

GGpoker在对抗较差的对手时,要适当的放弃GTO策略

更新时间:2022-05-02 01:20:47点击:142

大多数玩游戏的人都能直观地理解,仅由已知信息构成的游戏,如井字棋、跳棋和国际象棋,是如何被电脑解决的。但他们无法理解像扑克这样具有未知信息的游戏是如何被解决的。


GGpoker在对抗较差的对手时,要适当的放弃GTO策略(图1)


事实上,只要有足够的计算能力和时间,即使是最困难的游戏也可以用数学和博弈论来解决。


当一种游戏的博弈论最优(GTO)策略被确定时,它就被认为是“已解决”的。GTO策略非常强大,因为它要么不亏不盈(当对手也使用GTO策略时),要么获胜(当对手使用任何其他策略时)。


比无限德州扑克选择更少的游戏,比如限注德州扑克,几年前就已经解决了,而且甚至无限德州扑克也接近被解决。


2017年,卡内基梅隆大学开发的扑克机器人Libratus,以每百手牌超过14BB的赢率击败了四名最优秀的无限德州扑克牌手。比赛的盲注是1/2美元,相当于每百手牌盈利28美元,这是一个难以置信的高赢率。


有些牌手可能不明白机器人怎么可能知道如何以及何时聪明地诈唬,但事实证明,诈唬是博弈论课堂上被讨论的常见战术。


例如,你会经常发现自己在河牌圈有一个由强牌和垃圾牌组成的两极化范围,而对手有一个主要由边缘成手牌(输给你的强牌,但打败你的弱牌)构成的融合范围。在这种情况下,平均而言,范围两极化的牌手只需下注一个导致对手获胜的百分比时间和他的底池赔率相等的金额,就可以赢下底池。


懂了吗?


如果你知道对手的范围由67%的强牌和33%的诈唬牌构成,那就下注一个需要对手在33%的时候获胜的数额。


在这种情况下,底池大小下注将给对手2 : 1的底池赔率,意味着他需要在33%的时候获胜才能不亏不盈。因此,平均而言,无论对手怎么做,一个底池大小下注将让你赢得底池。


相反,如果你的范围由83%的强牌和17%的诈唬牌构成,下注1/4底池大小,给你的对手5 : 1的底池赔率,平均而言你将赢得底池。


由此产生的一个有趣概念是,当你的范围中有更多诈唬牌时,你可以使用更大的下注尺度。如果你的范围完美两极化,包括51%的强牌和49%的诈唬牌,你其实可以下注24.5倍底池大小(几乎没人会这么做)。


如果你使用目前的两种主流GTO Solver软件(PioSolver和MonkerSolver)进行研究,你就会发现一些模式会不断重复。例如,在决定在翻牌圈用什么牌对一个对手持续下注时,你主要关心的是你的范围与对手范围的对比情况。


如果你有胜率优势(意味着你在翻牌圈的整个范围的胜率比对手的整个范围的胜率高很多),你应该用你范围中的大部分牌频繁做小尺度下注。


如果你没有范围优势,你应该用一个由强成手牌和一些听牌构成的两极化范围以较低频率做大尺度下注,同时用你的边缘成手牌、垃圾牌和少数陷阱牌(慢玩的强牌)check。利用你这些知识,你可以开发一个可实施的系列,大致确定任何情况下的理想下注策略和check策略。


虽然GTO策略非常强大,但它通常是对抗世界上最优秀牌手的理想策略。当你的对手玩得较差时,你应该调整你的策略,以利用他们做得不好的任何事情。如果你严格遵循GTO策略,你就会在桌上留下很多钱。


被动剥削是,你采用GTO策略,无论对手做错什么,你都会赢钱;而主动剥削是,你为了进一步利用对手的错误而偏离GTO策略。最大程度的剥削性策略是,你以一种最大化(对抗对手的)收益的方式偏离GTO策略。


虽然有时很难知道特定对手做错了什么,但很多时候这是显而易见的。例如,许多小注额牌手几乎从不在河牌圈诈唬。


所以,如果你打到河牌圈,而具有这种倾向的对手check-raise,你应该放弃除最好成手牌外的任何牌。另一些牌手经常诈唬,让你可以轻松地用各种边缘成手牌跟注。这些都是主动剥削对手的例子。


使用最大程度剥削策略的主要问题是,你对对手策略的评估可能是不正确的。如果你认为对手从不诈唬,但他其实经常诈唬,若你对他的下注放弃大部分牌,你会被击溃。


如果你认为对手经常诈唬,从而你用很多边缘牌一直跟注他,但事实证明对手基本上从不诈唬,你也会被击溃。如果你的对手迅速而正确地进行针对性调整,以对抗你的最大程度剥削策略,你输掉的钱将超过你做初始调整潜在赢得的钱。


使用GTO策略可以避免这种困境,但从长远来看,假设你的评估基本正确,这也会导致你从非世界级对手那里赢得的钱减少。


因此,在你相当确定特定对手在对抗你时做了哪些不正确的事情之前,明智的做法是:考虑到你所知的普通牌手所做的一些不正确的事情,采用一种轻微调整的基础健全的策略(针对普遍性错误倾向的略微偏离GTO的策略)。