玩具博弈 (Toy Games)

定义

玩具博弈是真实扑克的极度简化版本,通过手工求解来理解GTO核心原理。真实扑克太复杂无法手工求解,玩具博弈通过移除大部分复杂度,让我们看到策略背后的数学驱动力。

核心方法:四步求解法

第一步:消除劣策略

通过逻辑推理找出”纯行动”——某些行动在任何情况下都不可能是最优的。

  • 例:极化vs抓诈唬博弈中,KK永远不该下注(只会被AA跟注被QQ弃牌)→ KK纯过牌
  • 由此推导:AA应总是下注(KK不会主动下注,慢打没意义)

第二步:计算诈唬/价值比

用底池赔率确定多少比例应该是诈唬,使对手在跟注和弃牌间无差异。

  • 诈唬比例 = s / (2s + 1),其中 s = bet/pot
  • 底池下注(s=1) → 33%诈唬,67%价值

第三步:计算防守频率

用 MDF 确定防守方应跟注多少使诈唬方无差异。

  • 跟注% = 1/(1+s)

第四步:推广公式

将解推广为包含变量(如s、t)的公式,适用于不同参数。

两种经典博弈

极化 vs 抓诈唬(无陷阱)

  • Hero:50% AA(坚果),50% QQ(空气)
  • Villain:100% KK(抓诈唬)
  • 解:AA总是下注,QQ按需诈唬使KK无差异,KK按MDF跟注

极化 vs 抓诈唬(有陷阱)

防守方有 t% 的陷阱(能击败Hero价值牌的牌):

  • 防守方跟注率 c = Max(MDF, t)
  • 价值牌被跟注时的权益 q = (c - t) / c
  • EV(value bet) = 1 + s(c - 2t) - t
  • 核心启示:最优下注尺度是坚果优势的函数

实战价值

玩具博弈虽不能直接用于牌桌,但培养了对 Solver 结果的深层理解:

  1. 理解MDF的由来:不是死记硬背的数值,而是”使对手无差异”的逻辑结果
  2. 理解下注尺度的决定因素:坚果优势、陷阱比例决定最优尺度
  3. 理解极化逻辑:价值/诈唬比的无差异推导
  4. 解读Solver趋势:当Solver选择某个尺度时,背后的”为什么”

相关概念

参考资料

  1. 源摘要-GTOWizard-玩具博弈求解 — Tombos21 (2022)

历史记录

  • 2026-04-30: 页面创建