How to Solve Toy Games

元数据

作者: Tombos21 (GTO Wizard)
日期: 2022-07-11
类型: 文章
原始文件: How to solve toy games.md

摘要

玩具博弈是简化版扑克模型，通过手工求解来理解GTO核心原理。文章演示了两种极化vs抓诈唬博弈的求解过程：基础版（无陷阱）和陷阱版（防守方有AA）。核心方法论分四步：消除劣策略→计算诈唬价值比→计算MDF防守频率→推广公式。

关键要点

求解四步法：
- 消除劣策略（纯策略逻辑推理）
- 用底池赔率计算诈唬/价值比
- 用MDF计算防守频率
- 推广为通用公式（引入s = bet/pot）
基础极化vs抓诈唬：AA总是下注，QQ按需诈唬使KK无差异，KK按MDF跟注
陷阱版博弈（防守方10%AA）：
- 防守方跟注率c = Max(MDF, 陷阱比例)
- 价值牌被跟注时的equity q = (c - t) / c
- 最优下注尺度是使EV最大化的s值
核心原理：最优下注尺度是坚果优势的函数——陷阱越多，越需控制下注尺度
推广公式：EV(value bet) = 1 + s(c - 2t) - t

影响的概念

完整笔记

四步求解法的详细展开

每个步骤都有其独特的逻辑价值：

第一步（消除劣策略） 训练的是”纯策略推理”——什么行动在任何情况下都不可能是最优的？这不需要任何数学，纯粹是逻辑。如”KK永远不应下注（只会被AA call、被QQ fold）”、“AA总是下注（KK不会bet、慢打没意义）“。这一步是Solver输出中最容易被人类理解的”纯策略”背后的原理。

第二步（价值/诈唬比） 揭示了底池赔率的深层含义。不是”我需要多少equity”，而是”我该多少频率诈唬才让对手无差异”。s = bet/pot → 诈唬比例 = s/(2s+1)。底池下注(s=1)=33%诈唬。

第三步（MDF防守频率） 是对手视角的第二步。防守方跟注%= 1/(1+s)，使诈唬方无差异。

第四步（推广） 是最有价值的一步——将具体数字替换为变量s、t，得出适用于任何参数的通用解。这培养了”不只看Solver输出某场景的策略，而是理解参数间函数关系”的思维。

👑 VIP 专属内容

陷阱版博弈核心贡献（下注尺度=坚果优势函数）、手工求解如何培养Solver解读能力、与斩首牌面的博弈变体关联。

🔒 深度策略内容已锁定
加入 JoyPoker 知识星球 解锁完整内容

✨ 精彩牌谱翻后分析
✨ 知识库源文档全量解锁
✨ 提前看最新课程笔记

加入后请查看「星球欢迎语」或「置顶帖」获取访问密码

👉 点击加入星球 🔗 跳转 VIP 专属知识库

JoyPoker

笔记-GTOWizard-玩具博弈求解

How to Solve Toy Games

元数据

摘要

关键要点

影响的概念

完整笔记

四步求解法的详细展开

目录