无差异原则 (Indifference Principle)

定义

无差异原则是博弈论最优(GTO)的核心数学原理:在均衡状态下,一个玩家在某个决策点上采取不同行动的预期价值必须相等。如果某个行动的EV更高,玩家就应该100%执行那个行动,直到对手调整使两者EV相等。

简单说:混合策略存在的唯一条件,就是各选项的EV完全一样。


底层逻辑

数学表达

EV(行动A) = EV(行动B) = EV(行动C)

如果 EV(A) > EV(B),则 B 的频率应为 0%
如果 EV(A) = EV(B),则混合比例不影响EV

通过反证法理解

假设你正在决定用 KK 在河牌面对下注是跟注还是弃牌:

  • 如果 跟注的EV > 弃牌的EV → 你应该100%跟注,不存在混合
  • 如果 跟注的EV < 弃牌的EV → 你应该100%弃牌,也不存在混合
  • 如果 跟注的EV = 弃牌的EV → 你跟注/弃牌的频率比例不影响长期结果,此时才有混合策略

对手的角度:对手让你在跟注和弃牌之间无差异,是TA的最优策略。因为只要你的跟注EV高于弃牌EV,你就赚了,对手就亏了。

与纳什均衡的关系

纳什均衡 = 所有玩家同时在所有决策点上达到无差异的状态。此时无人可单方面改变策略提高收益。


实战意义

1. 解释”平衡”的本质

很多玩家以为”平衡”就是”50%下注50%过牌”。无差异原则告诉你:平衡不是50/50,而是让对手在所有选择间无差异的比例。这个比例由底池赔率决定。

示例:你在河牌下注1个底池,对手跟注的底池赔率是2:1(需33%胜率)。根据MDF,对手需要跟注50%来让你在诈唬上无差异。此时你的价值:诈唬比例应为2:1(67%价值,33%诈唬),这样对手的抓诈牌在跟注和弃牌间无差异。

2. 混合策略不是”随机”而是”精确”

无差异原则决定了混合策略的精确频率。GTO求解器计算的就是这些频率。

3. 剥削的切入点

当你发现对手在某决策点上有偏向(例如跟注过多或弃牌过多),说明TA没有达到无差异。你的偏离GTO的策略可以让TA的单方面调整变得-EV。

4. 对你自己的意义

如果你在某场景下总做同一件事(永远过牌、永远加注),意味着你的策略在这个点上很可能不平衡——对手可以针对性剥削。


典型场景

场景无差异点说明
河牌下注对手抓诈牌在跟/弃间无差异下注频率由价值/诈唬比例控制
翻牌C-Bet对手边缘牌在跟/弃间无差异下注尺度决定对手MDF
面对3-bet你的4-bet诈唬牌在4-bet/弃牌间无差异4-bet频率由价值/诈唬比例决定

相关概念

无差异三定律

Tombos21 将无差异相关的博弈论原理总结为三条”硬法律”:

定律一:自私EV法则

没有任何手牌会牺牲自身EV去提升范围中其他手牌的EV。完美策略始终为每手牌选择最高EV行动。不存在”战略性-EV”行动。

定律二:无差异法则(=本页面核心定义)

如果一手牌混合多个行动,这些行动必然有相同的EV。

定律三:固定策略法则

在无差异行动间改变混合比例,不会在固定策略面前损失价值。GTO是固定策略——不惩罚混合错误,只惩罚纯错误。

三条定律具有传递性:自私EV → 无差异 → 固定策略

详见 源摘要-GTOWizard-无差异三定律

纯错误 vs 混合错误

纯错误 (Pure Mistake)混合错误 (Mixing Mistake)
定义选择了严格-EV的行动在无差异行动间使用错误频率
vs 固定策略损失EV不损失EV
vs 动态策略损失EV可被剥削
示例用0EV牌跟注KK应该30%跟注70%加注,但用了50/50

关键启示:GTO不惩罚混合错误——它只从纯错误中获利。但你的混合错误使你对动态(剥削性)策略变得可被攻击。

参考资料

  1. 源摘要-现代扑克理论 — 第2章(无差异原则)
  2. 源摘要-GTOWizard-无差异三定律 — Tombos21 (2022)
  3. 源摘要-GTOWizard-范围影响策略 — Tombos21 (2022)

历史记录

  • 2026-04-30: 新增无差异三定律与纯/混合错误区分
  • 2026-04-26: 页面创建