纳什均衡
纳什均衡(Nash Equilibrium)是博弈论中最重要的概念之一。
简单说: 当每个人都选择了对自己最有利的策略,并且没有人能通过单独改变自己的策略而变得更好时,就达到了纳什均衡。
这个概念由数学家 John Nash 提出,他后来因此获得了诺贝尔经济学奖。
用最简单的话解释
想象两个商家卖同样的饮料。
第一轮:A卖10元,B卖10元
A想: 我降到9元,会抢到更多顾客。
于是: A:9元,B:10元
B发现生意变差: 我也降到9元。
于是: A:9元,B:9元
如果双方继续考虑: A再降价会少赚钱, B再降价也会少赚钱
此时:
谁单独改变价格都不会让自己更好。
这就是一个纳什均衡。经典例子:囚徒困境
所以: 纳什均衡不一定是整体最优。
它只是: 每个人都没有动力单独改变策略。囚徒困境 Prisoner’s Dilemma, 是博弈论中的一个经典案例。
两人被分开审讯,各自面临坦白 / 抵赖选择。哪怕双方都抵赖结果最好,出于利己,最终大多会选择坦白,陷入两难。为什么重要?
现实世界很多现象都能用它解释。
价格战
企业不断降价。
最后大家利润都变低。
但谁也不敢先涨价。
军备竞赛
两个国家不断增加军费。
大家都花更多钱。
但谁也不敢先减少。
交通拥堵
每个人都选自己认为最快的路线。
结果全城堵车。
但单个司机换路也未必更快。一个生活例子
考试前:
全班原本学习2小时。
后来有人学4小时。
其他同学担心落后: 2小时 → 4小时 → 6小时 → 8小时
最后大家都很累。 但谁都不敢少学。 因为: 单独减少学习时间会让自己吃亏。
这也很像一种纳什均衡。数学上的定义
设有多个参与者。
如果对于每个参与者来说:
在其他人策略不变的情况下,自己无法通过单独改变策略获得更高收益,
则该策略组合是纳什均衡。与“囚徒困境”的关系
很多人会混淆:
- 囚徒困境(Prisoner’s Dilemma)是一种博弈模型;
- 纳什均衡是分析博弈结果的工具。
在囚徒困境中: (招供,招供)
就是纳什均衡。
一句话概括
纳什均衡就是:在一个多人博弈中,每个人都已经选好了对自己最有利的策略,任何人单独改变策略都不会变得更好,因此形成一种稳定状态。
而这种稳定状态,可能是好结果,也可能是大家都不满意却又难以摆脱的结果。