JoyPoker

❯

❯

❯

概念玩具博弈

概念-玩具博弈

2026年4月30日4分钟阅读

概念
玩具博弈
GTO方法论
博弈论

玩具博弈 (Toy Games)

定义

玩具博弈是真实扑克的极度简化版本，通过手工求解来理解GTO核心原理。真实扑克太复杂无法手工求解，玩具博弈通过移除大部分复杂度，让我们看到策略背后的数学驱动力。

核心方法：四步求解法

第一步：消除劣策略

通过逻辑推理找出”纯行动”——某些行动在任何情况下都不可能是最优的。

例：极化vs抓诈唬博弈中，KK永远不该下注（只会被AA跟注被QQ弃牌）→ KK纯过牌
由此推导：AA应总是下注（KK不会主动下注，慢打没意义）

第二步：计算诈唬/价值比

用底池赔率确定多少比例应该是诈唬，使对手在跟注和弃牌间无差异。

诈唬比例 = s / (2s + 1)，其中 s = bet/pot
底池下注(s=1) → 33%诈唬，67%价值

第三步：计算防守频率

用 MDF 确定防守方应跟注多少使诈唬方无差异。

跟注% = 1/(1+s)

第四步：推广公式

将解推广为包含变量（如s、t）的公式，适用于不同参数。

两种经典博弈

极化 vs 抓诈唬（无陷阱）

Hero：50% AA（坚果），50% QQ（空气）
Villain：100% KK（抓诈唬）
解：AA总是下注，QQ按需诈唬使KK无差异，KK按MDF跟注

极化 vs 抓诈唬（有陷阱）

防守方有 t% 的陷阱（能击败Hero价值牌的牌）：

防守方跟注率 c = Max(MDF, t)
价值牌被跟注时的权益 q = (c - t) / c
EV(value bet) = 1 + s(c - 2t) - t
核心启示：最优下注尺度是坚果优势的函数

实战价值

玩具博弈虽不能直接用于牌桌，但培养了对 Solver 结果的深层理解：

理解MDF的由来：不是死记硬背的数值，而是”使对手无差异”的逻辑结果
理解下注尺度的决定因素：坚果优势、陷阱比例决定最优尺度
理解极化逻辑：价值/诈唬比的无差异推导
解读Solver趋势：当Solver选择某个尺度时，背后的”为什么”

相关概念

概念-博弈论最优 — 玩具博弈是理解GTO的方法
概念-纳什平衡 — 玩具博弈的均衡解
概念-无差异原则 — 玩具博弈求解的核心逻辑
概念-最小防御频率 — 从玩具博弈推导出的防守指标
概念-范围极化 — 玩具博弈中极化范围的极端形式
概念-坚果优势 — 玩具博弈揭示的下注尺度决定因素

参考资料

笔记-GTOWizard-玩具博弈求解 — Tombos21 (2022)

历史记录

2026-04-30: 页面创建

JoyPoker B站主页

B站二维码

成为VIP会员

玩具博弈 (Toy Games)
定义
核心方法：四步求解法
第一步：消除劣策略
第二步：计算诈唬/价值比
第三步：计算防守频率
第四步：推广公式
两种经典博弈
极化 vs 抓诈唬（无陷阱）
极化 vs 抓诈唬（有陷阱）
实战价值
相关概念
参考资料
历史记录

微信：joy_poker
哔哩哔哩主页