博弈论笔记

纳什均衡

  • 纳什均衡(Nash Equilibrium)是博弈论中最重要的概念之一。

    简单说: 当每个人都选择了对自己最有利的策略,并且没有人能通过单独改变自己的策略而变得更好时,就达到了纳什均衡。

    这个概念由数学家 John Nash 提出,他后来因此获得了诺贝尔经济学奖。

  • 用最简单的话解释

    想象两个商家卖同样的饮料。

    第一轮:A卖10元,B卖10元
    A想: 我降到9元,会抢到更多顾客。
    于是: A:9元,B:10元
    B发现生意变差: 我也降到9元。
    于是: A:9元,B:9元
    如果双方继续考虑: A再降价会少赚钱, B再降价也会少赚钱
    此时:
    谁单独改变价格都不会让自己更好。
    这就是一个纳什均衡。

  • 经典例子:囚徒困境

    所以: 纳什均衡不一定是整体最优。
    它只是: 每个人都没有动力单独改变策略。

    囚徒困境 Prisoner’s Dilemma, 是博弈论中的一个经典案例。
    两人被分开审讯,各自面临坦白 / 抵赖选择。哪怕双方都抵赖结果最好,出于利己,最终大多会选择坦白,陷入两难。

  • 为什么重要?

    现实世界很多现象都能用它解释。

    价格战
    企业不断降价。
    最后大家利润都变低。
    但谁也不敢先涨价。
    军备竞赛
    两个国家不断增加军费。
    大家都花更多钱。
    但谁也不敢先减少。
    交通拥堵
    每个人都选自己认为最快的路线。
    结果全城堵车。
    但单个司机换路也未必更快。

  • 一个生活例子

    考试前:
    全班原本学习2小时。
    后来有人学4小时。
    其他同学担心落后: 2小时 → 4小时 → 6小时 → 8小时
    最后大家都很累。 但谁都不敢少学。 因为: 单独减少学习时间会让自己吃亏。
    这也很像一种纳什均衡。

  • 数学上的定义

    设有多个参与者。
    如果对于每个参与者来说:
    在其他人策略不变的情况下,自己无法通过单独改变策略获得更高收益,
    则该策略组合是纳什均衡。

  • 与“囚徒困境”的关系

    很多人会混淆:

    • 囚徒困境(Prisoner’s Dilemma)是一种博弈模型;
    • 纳什均衡是分析博弈结果的工具。
      在囚徒困境中: (招供,招供)
      就是纳什均衡。
  • 一句话概括

    纳什均衡就是:在一个多人博弈中,每个人都已经选好了对自己最有利的策略,任何人单独改变策略都不会变得更好,因此形成一种稳定状态。

    而这种稳定状态,可能是好结果,也可能是大家都不满意却又难以摆脱的结果。