无差异原则 (Indifference Principle)
定义
无差异原则是博弈论最优(GTO)的核心数学原理:在均衡状态下,一个玩家在某个决策点上采取不同行动的预期价值必须相等。如果某个行动的EV更高,玩家就应该100%执行那个行动,直到对手调整使两者EV相等。
简单说:混合策略存在的唯一条件,就是各选项的EV完全一样。
底层逻辑
数学表达
EV(行动A) = EV(行动B) = EV(行动C)
如果 EV(A) > EV(B),则 B 的频率应为 0%
如果 EV(A) = EV(B),则混合比例不影响EV
通过反证法理解
假设你正在决定用 KK 在河牌面对下注是跟注还是弃牌:
- 如果 跟注的EV > 弃牌的EV → 你应该100%跟注,不存在混合
- 如果 跟注的EV < 弃牌的EV → 你应该100%弃牌,也不存在混合
- 如果 跟注的EV = 弃牌的EV → 你跟注/弃牌的频率比例不影响长期结果,此时才有混合策略
对手的角度:对手让你在跟注和弃牌之间无差异,是TA的最优策略。因为只要你的跟注EV高于弃牌EV,你就赚了,对手就亏了。
与纳什均衡的关系
纳什均衡 = 所有玩家同时在所有决策点上达到无差异的状态。此时无人可单方面改变策略提高收益。
实战意义
1. 解释”平衡”的本质
很多玩家以为”平衡”就是”50%下注50%过牌”。无差异原则告诉你:平衡不是50/50,而是让对手在所有选择间无差异的比例。这个比例由底池赔率决定。
示例:你在河牌下注1个底池,对手跟注的底池赔率是2:1(需33%胜率)。根据MDF,对手需要跟注50%来让你在诈唬上无差异。此时你的价值:诈唬比例应为2:1(67%价值,33%诈唬),这样对手的抓诈牌在跟注和弃牌间无差异。
2. 混合策略不是”随机”而是”精确”
无差异原则决定了混合策略的精确频率。GTO求解器计算的就是这些频率。
3. 剥削的切入点
当你发现对手在某决策点上有偏向(例如跟注过多或弃牌过多),说明TA没有达到无差异。你的偏离GTO的策略可以让TA的单方面调整变得-EV。
4. 对你自己的意义
如果你在某场景下总做同一件事(永远过牌、永远加注),意味着你的策略在这个点上很可能不平衡——对手可以针对性剥削。
典型场景
| 场景 | 无差异点 | 说明 |
|---|---|---|
| 河牌下注 | 对手抓诈牌在跟/弃间无差异 | 下注频率由价值/诈唬比例控制 |
| 翻牌C-Bet | 对手边缘牌在跟/弃间无差异 | 下注尺度决定对手MDF |
| 面对3-bet | 你的4-bet诈唬牌在4-bet/弃牌间无差异 | 4-bet频率由价值/诈唬比例决定 |
相关概念
- 概念-混合策略 — 无差异原则的直接产物
- 概念-博弈论最优 — GTO的理论根基
- 概念-纳什平衡 — 全局无差异状态
- 概念-最小防御频率 — MDF是让对手诈唬无差异的频率
- 概念-价值诈唬 — 河牌价值/诈唬比例的无差异推导
- 概念-剥削策略分类 — 偏离无差异 = 剥削或被剥削
无差异三定律
Tombos21 将无差异相关的博弈论原理总结为三条”硬法律”:
定律一:自私EV法则
没有任何手牌会牺牲自身EV去提升范围中其他手牌的EV。完美策略始终为每手牌选择最高EV行动。不存在”战略性-EV”行动。
定律二:无差异法则(=本页面核心定义)
如果一手牌混合多个行动,这些行动必然有相同的EV。
定律三:固定策略法则
在无差异行动间改变混合比例,不会在固定策略面前损失价值。GTO是固定策略——不惩罚混合错误,只惩罚纯错误。
三条定律具有传递性:自私EV → 无差异 → 固定策略
纯错误 vs 混合错误
| 纯错误 (Pure Mistake) | 混合错误 (Mixing Mistake) | |
|---|---|---|
| 定义 | 选择了严格-EV的行动 | 在无差异行动间使用错误频率 |
| vs 固定策略 | 损失EV | 不损失EV |
| vs 动态策略 | 损失EV | 可被剥削 |
| 示例 | 用0EV牌跟注 | KK应该30%跟注70%加注,但用了50/50 |
关键启示:GTO不惩罚混合错误——它只从纯错误中获利。但你的混合错误使你对动态(剥削性)策略变得可被攻击。
参考资料
- 源摘要-现代扑克理论 — 第2章(无差异原则)
- 源摘要-GTOWizard-无差异三定律 — Tombos21 (2022)
- 源摘要-GTOWizard-范围影响策略 — Tombos21 (2022)
历史记录
- 2026-04-30: 新增无差异三定律与纯/混合错误区分
- 2026-04-26: 页面创建