Understanding Nash Distance
元数据
- 作者: Tombos21 | 日期: 2022-05-26
- 原始文件: GTOWizard-Understanding-Nash-Distance.md
摘要
解释 Solver 输出中”为什么低 EV 行动被选择”的谜题。核心:Solver 未被解到完美精度 → 存在求解器噪音。混合行动的 EV 差异 = 噪音(非真实差异)。解到完美精度后,所有混合行动 EV 将完全相等。 dEV 衡量解法距均衡的距离。
关键要点
- 均衡中混合行动必须 EV 相等(无差异原则)
- Solver 输出中 EV 不等的混合 = 求解器噪音,非真实策略特性
- dEV(纳什距离)= 最优剥削策略 vs 当前策略的 EV 差距
- GTO Wizard 精度≈0.2-0.3% pot—远超人类水平
- 精度翻倍 = 求解时间翻倍,收益递减
- 低频行动(<3.5%)通常是噪音,将随精度提升消失
影响的概念
完整笔记
混合行动的无差异法则
博弈论的硬性法则:在完美纳什均衡中,当一个手牌混合两个或多个行动时,这些行动的EV必须完全相等。否则你就是在刻意选择一个更差的策略,这与均衡的定义矛盾。均衡策略永远不会”为了平衡而牺牲EV”——平衡本身就是最大化EV的结果。
这是理解Solver输出的理论基石。当你看到一个手牌同时check和bet,且两个行动的EV不相等时,那不是策略设计如此,而是求解未完成的表现。



