玩具博弈 (Toy Games)
定义
玩具博弈是真实扑克的极度简化版本,通过手工求解来理解GTO核心原理。真实扑克太复杂无法手工求解,玩具博弈通过移除大部分复杂度,让我们看到策略背后的数学驱动力。
核心方法:四步求解法
第一步:消除劣策略
通过逻辑推理找出”纯行动”——某些行动在任何情况下都不可能是最优的。
- 例:极化vs抓诈唬博弈中,KK永远不该下注(只会被AA跟注被QQ弃牌)→ KK纯过牌
- 由此推导:AA应总是下注(KK不会主动下注,慢打没意义)
第二步:计算诈唬/价值比
用底池赔率确定多少比例应该是诈唬,使对手在跟注和弃牌间无差异。
- 诈唬比例 = s / (2s + 1),其中 s = bet/pot
- 底池下注(s=1) → 33%诈唬,67%价值
第三步:计算防守频率
用 MDF 确定防守方应跟注多少使诈唬方无差异。
- 跟注% = 1/(1+s)
第四步:推广公式
将解推广为包含变量(如s、t)的公式,适用于不同参数。
两种经典博弈
极化 vs 抓诈唬(无陷阱)
- Hero:50% AA(坚果),50% QQ(空气)
- Villain:100% KK(抓诈唬)
- 解:AA总是下注,QQ按需诈唬使KK无差异,KK按MDF跟注
极化 vs 抓诈唬(有陷阱)
防守方有 t% 的陷阱(能击败Hero价值牌的牌):
- 防守方跟注率 c = Max(MDF, t)
- 价值牌被跟注时的权益 q = (c - t) / c
- EV(value bet) = 1 + s(c - 2t) - t
- 核心启示:最优下注尺度是坚果优势的函数
实战价值
玩具博弈虽不能直接用于牌桌,但培养了对 Solver 结果的深层理解:
- 理解MDF的由来:不是死记硬背的数值,而是”使对手无差异”的逻辑结果
- 理解下注尺度的决定因素:坚果优势、陷阱比例决定最优尺度
- 理解极化逻辑:价值/诈唬比的无差异推导
- 解读Solver趋势:当Solver选择某个尺度时,背后的”为什么”
相关概念
- 概念-博弈论最优 — 玩具博弈是理解GTO的方法
- 概念-纳什平衡 — 玩具博弈的均衡解
- 概念-无差异原则 — 玩具博弈求解的核心逻辑
- 概念-最小防御频率 — 从玩具博弈推导出的防守指标
- 概念-范围极化 — 玩具博弈中极化范围的极端形式
- 概念-坚果优势 — 玩具博弈揭示的下注尺度决定因素
参考资料
- 源摘要-GTOWizard-玩具博弈求解 — Tombos21 (2022)
历史记录
- 2026-04-30: 页面创建