推弃牌均衡计算问题集

概述

本问题集基于《现代扑克理论》第2章中的推弃牌(Push/Fold)迭代示例,通过10bb HU场景的多次策略迭代,测试对最大化剥削策略(MES)、反剥削调整和纳什均衡收敛过程的理解。

使用建议

  1. 先阅读相关概念页面(概念-博弈论最优概念-纳什平衡),再尝试回答问题
  2. 使用计算器辅助计算底池赔率和最低权益需求
  3. 对于错误的问题,复习相关数学公式

场景设定

10bb HU Sit N’ Go,盲注5/10,BN=100,BB=100。双方只能选择全押或弃牌。

问题

第一部分:基础计算(2题)

问题1:底池赔率计算

问题:BN全押10bb(90筹码),BB需要跟注90筹码赢取总底池200筹码(90+90+10+10)。BB跟注所需的最低权益是多少?

  • A) 40%
  • B) 45%
  • C) 50%
  • D) 55%
答案与解析

答案:B

解析: 底池赔率 = 风险 / (风险 + 回报) = 90 / (90 + 110) = 90 / 200 = 0.45 = 45%

BB需要至少45%的权益才能盈亏平衡地跟注BN的任意两张牌全押。

公式Pot Odds = Risk / (Risk + Reward)


问题2:MES跟注范围

问题:假设BN全押100%手牌(任意两张牌),BB需要跟注哪些手牌以实现最大化剥削策略(MES)?已知以下手牌对阵随机牌的权益:

  • 72o vs 随机牌 ≈ 35%

  • J6o vs 随机牌 ≈ 43%

  • Q2o vs 随机牌 ≈ 44%

  • K2o vs 随机牌 ≈ 45%

  • 22 vs 随机牌 ≈ 50%

  • A) 仅权益 > 50%的手牌

  • B) 所有权益 ≥ 45%的手牌

  • C) 所有权益 ≥ 40%的手牌

  • D) 所有对子和Ax

答案与解析

答案:B

解析:MES的核心原则是每手牌独立决策——只要一手牌的跟注EV为正,就应该跟注。BN全押100%时,BB需要45%权益才能盈亏平衡,所以所有权益≥45%的手牌都应跟注。

根据数据,K2o(45%)是临界点,22(50%)当然可以,但Q2o(44%)和J6o(43%)略低于门槛应该弃牌。

MES跟注范围约为全部手牌的66.21%,即所有权益≥45%的手牌组合。

相关概念概念-博弈论最优概念-混合策略


第二部分:迭代过程(3题)

问题3:反剥削调整

问题:如果BN知道BB的MES跟注范围是66.21%(即会用所有权益≥45%的手牌跟注),BN可以调整全押范围来反剥削。以下哪项描述最准确?

  • A) BN应该扩大全押范围,因为BB跟注太松
  • B) BN应该收紧全押范围,弃掉那些被BB跟注范围主导的手牌
  • C) BN应该保持100%全押不变
  • D) BN应该只全押AA
答案与解析

答案:B

解析:当BB跟注66.21%时,BN很多弱牌的弃牌权益降低了(BB不再弃牌),同时被跟注时EV为负。BN需要计算每手牌vs BB跟注范围的EV:

EV(全押) = 弃牌率 × 底池 + 跟注率 × EV(被跟注时)

BN通过收紧范围(从100%降到46.61%),弃掉那些被BB范围主导的弱牌,可以提升整体EV。这就是反剥削——针对对手的已知策略做出最优调整。

迭代1→2数据:BN的EV从1.22提升到6.25,BB的EV从13.77降到8.48。

相关概念概念-剥削性调整


问题4:多轮迭代的收敛

问题:经过多轮迭代后,双方的EV变化如下:

玩家迭代1 EV迭代2 EV迭代3 EV纳什均衡EV
BN1.226.254.234.55
BB13.778.4810.7510.45

以下哪项分析最准确?

  • A) BN和BB的EV在每轮迭代后都单调递增
  • B) 纳什均衡EV是双方EV的算术平均值
  • C) 纳什均衡为双方提供了”保底EV”——无论对手策略如何,至少获得该数值
  • D) BB在迭代1的EV最高,所以迭代1的策略是BB的最优策略
答案与解析

答案:C

解析

  • A错误:BN在迭代2→3的EV从6.25降至4.23,不是单调递增
  • B错误:纳什均衡EV不是简单的算术平均,而是双方互相最大化剥削的稳定点
  • C正确:GTO/纳什均衡的核心优势——保证最低EV。即使对手知道你的策略并完美反制,你的EV也不会低于均衡值
  • D错误:迭代1的13.77建立在BN犯错(全押100%)的基础上,如果BN调整策略,BB的EV会大幅下降

纳什均衡的保底特性使其在对抗未知或高水平对手时特别有价值。

相关概念概念-纳什平衡


问题5:GTO vs 剥削性策略的选择

问题:在10bb HU推弃牌游戏中,GTO(纳什均衡)策略为BN全押58.3%、BB跟注37.4%。以下哪种情况最适合偏离GTO、采用剥削性策略?

  • A) 对手是未知玩家,第一次交手
  • B) 观察到对手在BB位跟注过宽(超过50%)
  • C) 比赛中筹码极短(5bb以下)
  • D) 自己技术明显优于对手
答案与解析

答案:B

解析

  • A不适合:对未知玩家使用GTO是合理选择,保底EV
  • B最适合:如果发现BB跟注50%+(远超GTO的37.4%),BN应收紧全押范围,只用强牌全押(因为弱牌的弃牌权益降低),这属于基于实际观察的剥削性调整。BN的迭代1→2就是从BB过度跟注中获利(弃掉弱牌、提升EV)
  • C不正确:5bb以下GTO策略本身就会调整,不等于偏离GTO
  • D过于模糊:技术优势不等于应该偏离GTO,需要具体的对手漏洞信息

关键原则:偏离GTO需要具体的对手漏洞信息。没有信息时GTO是最安全的选择。

相关概念概念-博弈论最优概念-剥削性调整


第三部分:综合应用(2题)

问题6:纳什均衡的收敛条件

问题:在推弃牌迭代过程中,如果双方的策略在迭代过程中来回振荡、无法收敛到纳什均衡,以下哪种方法可能帮助收敛?

  • A) 增加迭代速度,每次直接切换到最佳响应
  • B) 每次迭代时只向最佳响应方向调整一小步,而非完全切换
  • C) 随机选择策略
  • D) 放弃迭代,直接使用直觉判断
答案与解析

答案:B

解析:当策略在迭代中振荡时,说明完全切换(从A直接跳到B)的幅度过大。解决方案是”软调整”——每次根据最佳响应方向移动一小步,而不是完全切换到新策略。这类似于梯度下降中的学习率控制。

这在实际扑克学习中也有启示:大幅度调整策略(从极紧到极松)往往不稳定,渐进式调整更可靠。

相关概念概念-纳什平衡


问题7:MES与混合策略的关系

问题:以下关于MES(最大化剥削策略)的描述,哪一项最准确?

  • A) MES中每手牌只能有一种玩法(要么全押要么弃牌,不能混合)
  • B) MES中一手牌可以有混合策略,但仅当两种玩法的EV完全相等时
  • C) MES中混合策略总是优于纯策略
  • D) MES不考虑底池赔率
答案与解析

答案:B

解析:MES的核心是每手牌独立追求最大EV。如果一手牌的全押EV和弃牌EV不同,MES会选择EV更高的那个(纯策略)。但若两种选项的EV完全相等,则可以以任意比例混合——这就是无差别原则(The Indifference Principle)。

这也是为什么纳什均衡中可能出现混合策略:均衡是双方相互MES的结果,当两种行动EV相同时,混合策略自然出现。

相关概念概念-混合策略概念-博弈论最优


第四部分:扩展思考(1题)

问题8:真实扑克中的推弃牌

问题:在实际扑克锦标赛中,10bb时的推弃牌决策比上述简化模型更复杂。以下哪项因素在简化模型中被完全忽略但在实战中至关重要?

  • A) 手牌权益计算
  • B) 位置
  • C) ICM压力
  • D) 底池赔率
答案与解析

答案:C

解析

  • A和D中,手牌权益和底池赔率都被模型包含
  • B中,位置在HU中天然对等,但多人桌中UTG vs BTN的推弃牌差异巨大,模型未覆盖
  • C最准确:模型假设筹码的现金价值是线性的(1筹码=1单位价值),但锦标赛中有ICM(独立筹码模型)——筹码的实际价值非线性,接近钱圈时每多赢1筹码的价值低于已拥有的筹码

实战中10bb时需要考虑:钱圈压力、 payout结构、对手 ICM 意识等。推弃牌模型是基础,但需要结合锦标赛动态调整。

相关概念概念-ICM概念-博弈论最优


迭代数据汇总

迭代BN全押范围BB跟注范围BN EVBB EV
迭代1100%66.21%1.2213.77
迭代246.61%30.3%6.258.48
迭代34.2310.75
纳什均衡58.3%37.4%4.5510.45

关键洞察

  • BB的GTO保底EV为10.45,但若错误假设BN全押100%而跟注66.21%,面对BN反剥削时EV降至8.48
  • GTO不要求最大EV,只保证最低EV——这是对抗强敌时的安全网
  • 迭代过程展示了剥削→反剥削→均衡收敛的完整逻辑链

相关概念