更新时间:2021-01-29 23:11:40点击:131
最明显的变化就是许多老派玩家过去通过剥削玩法赢取上百万的资金,而现在几乎所有有能力赢取百万资金的玩家都依赖于德州扑克中的博弈论 – 同时混合剥削打法 – 将他们的游戏带入下一个层次。
在这篇文章里,我们将会讨论:
1. 博弈论和扑克的基础
2. 为什么要用博弈论影响策略
3. Doug Polk 强调博弈论重要性的一个例子
4. 运用博弈论影响策略的4大好处
让我们开始吧!
博弈论和德州扑克 John Nash与1950年左右在普林斯顿大学发展了博弈论并把它作为数学的一个分支。由于德州扑克在过去15年中变的越来越流行,玩家数量有了显著的提高,以至于你如果对博弈论一窍不通的话,你将很难像以前一样征服游戏。 从数学上看,德州扑克的复杂性体现在 – 从翻牌前你在不同位置入场的手牌, 到一个小底池中一个看似不重要的河牌圈过牌,每一个决定都会影响你作为德州扑克玩家的胜率。这可以用期望值(EV-expected value)来衡量。如果一个决定是有利可图的那么我们称之为+EV, 如果不是有利可图的,我们就称为-EV。 使用一个理论上平衡的策略的一个很简单的例子是当玩家加注进场时的手牌范围。下面是一个典型的位于UTG(翻牌前第一个行动)玩家加注进场的手牌范围。 在UTG位置用我们非常强的起手牌来加注进场显然是有利可图的,但是如果只玩那些强牌将使得我们的手牌太容易被对手预测。 通过用一些不那么有利可图的手牌也加注进场-例如9s8s或者6h6c-我们平衡了我们加注进场的范围,使我们更难对付。通过这样的玩法,即使在一个翻牌都是小牌或者中等牌的牌面时,我们仍然有可能击中非常强的牌。 为何使用GTO(Game Theory Optimal最优平衡策略-中文翻译来自于德研社姜社长知乎文中的建议)德州扑克策略? 你可能会想,你大多数盈利都是来自于剥削那些弱的玩家和那些根本没有投入到游戏的玩家时,为什么基于博弈论来制定你的策略还是那么重要。 主要是有两个原因: 1. 使用一个平衡的,GTO作为基础的策略,从长远来看无论你的对手技巧多么娴熟你都会赢钱。 2. 如果你基于GTO策略来针对你的对手进行调整将会更加的容易(稍后详细分析) 从GTO角度来看,你每次进行手牌回顾时应该包括分析如何客观的打每一手牌。从这个角度出发,你可以决定你是否用一种平衡的方式来游戏你的手牌范围。此外,从GTO角度来看你会知道在任何特定的场合你的任何手牌该怎么玩,而不仅仅是处理你当前手上的两张牌。所以,在你进行手牌回顾时你应该问问你自己,当你手持不同的牌时会做出什么行动。 如果你在某些情况下进行价值下注,你也应该用你手牌范围中的其他牌进行诈唬下注,让你的对手不确定你到底是在做价值下注还是在诈唬。如果你在特定的河牌只做价值下注的话,你的对手会知道你有牌而每次都做出有利可图的弃牌。另一方面,如果你在某些特定的情况诈唬太多,你的对手将会知道你很少会有一手强牌,而一直进行有利可图的跟注。 德扑博弈论的例子 河牌圈你在$100的底池中下注了$100,所以你的对手必须跟注$100才能赢得$200。因此,你的对手得到了2:1的底池赔率同时需要至少在33%的时候获胜才能盈亏平衡。 快速计算一下你的最佳河牌诈唬下注比例: 33%(每两个价值下注搭配一个诈唬下注)。这个频率是最佳的平衡的,因为它允许你经常在不被反击的情况下赢得底池。 让我们来测试下4种不同的 诈唬-价值 下注场合让你明白为什么一个由33%诈唬牌和67%价值牌组成的下注范围从GTO角度来看是最好的,让你的对手束手无策。 (为简单起见,假设我们被对手跟注的时候我们的价值下注总是赢,诈唬下注总是输。) 场景一 – 诈唬0% 价值下注100% 你的对手可以在100%的时候弃牌。结果导致你的下注范围每次可以赢得$100. 场景二 – 诈唬100% 价值下注0% 你的对手可以在100%的时候跟注。结果导致你的下注范围每次输掉$100. 场景三 – 诈唬50% 价值下注50% 如果你的对手100%情况下跟注,你价值下注的时候赢$200,诈唬下注的时候输$100。结果将导致当你对手总是跟注时你的下注范围平均每次为你赢得$50 (50%*100=50;50%*200=100;100-50=50) 另一方面,当你对手总是弃牌的时候,你每次赢得$100(同场景一) 这个场景表明无论你从不诈唬还是在50%的时候诈唬收益是一样的。 场景四 – 诈唬33% 价值下注67% 如果你的对手总是跟注,你将在价值下注的时候赢得$200,诈唬下注的时候损失$100。不过,这一次,你只有在33%的时候损失$100,而在67%的时候赢得$200,平均每次净利润为$100(33%*100=33, 67%*200=133, 133-33=100)。 这个场景中使用的 诈唬-价值 下注的比例是最优的,因为: 如果你的对手总是跟注,平均每次你能赢得$100 如果你的对手总是弃牌,平均每次你能赢得$100 你获取$100的利润无论你的对手跟注或是弃牌。这种双赢的局面只有在使用一个完美平衡的范围时才能实现。你对手的跟注和弃牌选择将无足轻重,因为无论他做出哪种选择,你的范围将会为你带来相同数目的盈利。 调整这个比例来剥削弱的玩家将变的更加有利可图,但是需要依据可靠的证据进行仔细和正确的调整。如果你想提高你的游戏级别同时长期征服游戏,理解GTO策略是必不可少的。 (译者注:很多新手玩家可能会问,采用场景四的混合策略和场景一中只做价值下注收益都是$100,为什么要用GTO呢?请自行思考:P) 采用GTO的4大好处 最后,我们看一下使用坚实的GTO策略带来的4个普遍好处。 1. 避免循环思考 从90年代遗留下来的一个扑克训练是尝试了解你的对手是在哪个思维层级进行游戏。 思维层级从你只考虑自己的手牌开始。 然后到思考你的对手可能有什么。 然后再到你的对手认为你有什么。 然后进一步到你认为你的对手认为你认为他有什么……等等等等。 理想情况下,你应该以某种方式结束这种“思维层级”分析过程 – 那就是,你确定你的对手的思维层级,然后针对性的做出调整。但是现实是这个“思维层级”分析的过程对于弱的玩家是非常不可靠的。同时面对更有经验的玩家,理论上当两个玩家不断试图去领先对面的思维层级,这种思考方式很可能会无限的循环下去。 2. 避免做出假设 另一个基于GTO基础对扑克的好处是避免你对对手做出很多潜在的错误的假设。当然,你如果跟某个对手打了足够多的手牌,你可以做出某些特定的假设,但是这些常规的假设带来的代价往往也是非常昂贵的。 例如,当你说出“这绝不可能是诈唬”或“他肯定有牌”这样的话时是不明智的。同样的,你不应该假设一个不了解的对手在他的手牌范围中不可能有特定的手牌,或者他们开牌范围非常的宽或者紧。 一个完善的GTO策略可以消除困惑,并帮助你做出长期盈利的行动。 3. 客观的分析 很多玩家会根据结果错误的判断他们玩一手牌的方式。但是,当一个玩家在扑克生涯中进步越大,就越会意识到结果如何与他无关。 然而,客观的思考是非常困难的,尤其是当一手牌的结果非常好或者非常烂的时候。仅仅因为你在河牌击中了你的葫芦并清空了你对手的筹码并不意味着之前连续跟注两条街的行动就是正确的玩法。 一旦你已经计算出在某个点上正确的GTO策略是什么,把他应用到你的牌局分析时间中去,看看你是否可以用你的范围做出长期有利可图的玩法,而不是特定的两张牌。 每一个成功的扑克玩家都知道,承认自己的错误对保持良好的竞技状态至关重要。博弈论为你更容易找出自己的错误提供了基础。 4. 让你的调整变的更加容易 为什么GTO在你进行难以对付的策略调整时那么重要?让我们来玩一个小游戏。 假设你忘记了除了游戏的最基本的知识以外的所有关于扑克策略的一切,现在你要开始去玩你的第一手牌了。 现场盲注$1/$2, 有效筹码深度$200 你在大盲位置手持A♦ 9♦ 其他所有人弃牌到庄家位,庄家位玩家加注到$7,小盲弃牌,你跟注。 翻牌($14) A♠ T♦ 3♥ 你过牌,庄位玩家下注$9,你跟注。 转牌($32) J♣ 你过牌,庄位玩家下注$21,你跟注。 河牌($74) 9♣ 你过牌,庄位玩家下注$50,你跟注。 庄位亮出手牌A♥2♣,你用两对赢下了$174. 你怎么看待庄位玩家用他的弱顶对表现出来的攻击性?你怎么调整才能在将来更好的针对剥削他?嗯,如果你无法理解他那手特定牌的理论正确的玩法的话,你就不知道从何入手。 另一方面,如果你知道在按钮位置用理论正确的方法去玩A2o的话,那么你就会知道他是怎么偏离理论正确打法的。这个知识让我们很容易推断出该怎么利用剥削这个对手。 这里是我们可以做的具体调整,来粉碎这个玩家激进的薄价值下注的策略: 弱剥削策略:当他下注和连续下注时可以跟注的更松一点(但是不要太松) 强剥削策略:无情的攻击他的过牌范围 – 他的过牌范围将非常的孱弱 – 用大的薄价值下注混合着适量的诈唬。 通常,理解理论上玩一手牌的最佳方法会让你更容易的剥削你的对手因为你清楚的知道他们是如何偏离理论最优玩法的。当你不知道什么是正确的玩法的时候,你将几乎不可能知道什么是错误的玩法。 结论 追求完美的GTO策略看起来是合乎逻辑的结论,但事实是没人可以做出完全的最佳平衡策略的玩法。 德州扑克还没有被人或机器解决,但我们仍然强烈建议尽可能的去使用博弈论来影响你的游戏策略。一如既往,这意味着尽量不要依靠感觉去打牌。 这篇文章对博弈论在德州扑克中的应用做了一个非常基本的总结,但希望你从中可以获得一些东西,或者至少对如何运用博弈论的概念来改进你的打牌方式感兴趣。