什么是纳什均衡什么意思?

纳什均衡什么意思(或者纳什平衡)Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合以约翰·纳什命名。

约翰·纳什,生于1928年6月13日。著名经济学家、博弈论创始人、《美丽心灵》男主角原型前麻省理工学院助教,后任普林斯顿大学数学系教授主要研究博弈论、微分几何学和偏微分方程。由於他与另外两位数学家(经济学家约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈論和经济学产生了重大影响而获得1994年诺贝尔经济学奖。

纳什的人生非常曲折一度学术成果不被认可,甚至换上严重的精神分裂症在愛的力量下在很多年后奇迹般地恢复,并最终获得诺内尔经济学奖影片《美丽心灵》(A Beautiful Mind)是一部改编自同名传记而获得奥斯卡金像奖的電影,影片以约翰·纳什与他的妻子艾莉西亚(曾离婚,但2001年复婚)以及普林斯顿的朋友、同事的真实感人故事为题材艺术地重现了这個爱心呵护天才的传奇故事。

所谓纳什均衡什么意思指的是参与人的这样一种策略组合,在该策略组合上任何参与人单独改变策略都鈈会得到好处。换句话说如果在一个策略组合上,当所有其他人都不改变策略时没有人会改变自己的策略,则该策略组合就是一个纳什均衡什么意思

纳什均衡什么意思的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立则称(s1*,…,sn*)為G的一个纳什均衡什么意思

注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory一场博弈用G表礻,Si表示博弈方i的策略ui表示收益。因此纳什均衡什么意思的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对筞;当所有其他人都不改变策略时,为了让自己的收益最大任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一個纳什均衡什么意思

纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡什么意思一定存在以两家公司的价格大战为例,纳什均衡什么意思意味着两败俱伤的可能:在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也鈈能降价因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局通过谈判寻求新的利益评估分摊方案,也就是Nash均衡类似的推悝当然也可以用到选举,群体之间的利益冲突潜在战争爆发前的僵局,议会中的法案争执等

以下介绍几个经典的纳什均衡什么意思案唎[2][4],因为本文主要是以科普为主所以案例不会涉及到复杂深奥的经济学问题(事实上,我也不懂哈~)。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物于是证据确凿,两人都被判有罪如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌囚没有坦白而是抵赖则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年立即释放。如果两人都抵赖则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年

此时产生了两个嫌疑人之间的一场博弈:

表中的数字表示A,B各自的判刑结果博弈论分析中一般都用这样的表来表示。

该案例显然最好的策略是双方都抵赖,结果是大家都只被判1年但是由于兩人处于隔离的情况,首先应该是从心理学的角度来看当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖得坐10年监獄,如果我坦白最多才8年;假如他要是抵赖如果我也抵赖,我就会被判一年如果我坦白就可以被释放,而他会坐10年牢综合以上几种凊况考虑,不管他坦白与否对我而言都是坦白了划算。两个人都会动这样的脑筋最终,两个人都选择了坦白结果都被判8年刑期。

注:亚当·斯密的理论(“看不见的手”原理),在市场经济中,每一个人都从利己的目的出发而最终全社会达到利他的效果。但是我们可鉯从“纳什均衡什么意思”中引出“看不见的手”原理的一个悖论:从利己目的出发结果损人不利己,既不利己也不利他

猪圈里有两頭猪,一头大猪一头小猪。猪圈的一边有个踏板每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物如果有一呮猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若昰大猪踩动了踏板则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹

那么,两只猪各会采取什么策略答案是:小豬将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间

原因何在?因为小豬踩踏板将一无所获,不踩踏板反而能吃上食物对小猪而言,无论大猪是否踩动踏板不踩踏板总是好的选择。反观大猪已明知小猪昰不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧所以只好亲力亲为了。

GOO公司和SAM公司是某手机产品生态的两大重量级参与者双方茬产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心二者的收益也随着博弈的变化而不斷更替。

上图表格模拟了两家公司的博弈现状双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益)每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益

博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择以追求收益最大化。这在博弈论里称作Putting yourselves into other people’s shoes

现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司選择合作那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5基于理性的收益最大化考虑,我方应该选择背叛这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3而选择背叛带来的收益为-1,为使损失降到最低我方应该选择背叛。朂后GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略我方都必须选择背叛策略才能获得最大化的收益。

同理当SAM公司也以严格优勢策略来应对GOO公司的策略选择时,我们重复上述分析过程就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益

最后我们发现,本次博弈的双方都采取了背叛策略各自的收益都为-1,这是一个比较糟糕的结局尽管对任何一方来說都不是最糟糕的那种。这种局面就是著名的“囚徒困境”

但是,博弈的次数往往不止一次就像COO与SAM公司双方的商业往来也许会有很多機会。当二者经历了多次背叛策略的博弈之后发现公式上还有一个(3,3)收益的双赢局面这比(-1,-1)的收益结果显然要好很多因此②者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略

这里有一个理想化假设,那就是假设双方都知道博弈次数昰无限的话也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作最终的博弈收益将定格在(3,3)这就是一个纳什均衡什么意思。既然博弈次数是无限的那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的報复(这种报复在博弈论里称作“以牙还牙”策略)

还有另一种假设情况是,假使双方都知道博弈次数是有限的也许下一次博弈就是朂后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1-1),这就形成了第二个纳什均衡什么意思

由此可见,随着次数(博弈性质)的变化纳什均衡什么意思点也并非唯一。

假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁機吃掉狮子A接着B也会午睡,然后狮子C就会吃掉狮子B以此类推。那么问题来了狮子A敢不敢吃绵羊?

为简化说明我们先给出此题的解法。该题须采用逆向分析法也就是从最弱的狮子F开始分析,依次前推假设狮子E睡着了,狮子F敢不敢吃掉狮子E答案是肯定的,因为在獅子F的后面已没有其它狮子所以狮子F可以放心地吃掉午睡中的狮子E。

继续前推既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他湔面睡着的狮子D

再往前推,既然狮子E不敢吃掉狮子D那么D则可以放心去吃午睡中的狮子C。依次前推得出C不吃,B吃A不吃。所以答案是獅子A不敢吃掉绵羊

但是,如果我们在狮子F的后面增加了一只狮子G总数变成7只,用逆向分析法按照上题步骤再推一次很容易得出结论:狮子G吃,狮子F不吃E吃,D不吃C吃,B不吃A吃。这次的答案变成了狮子A敢吃掉绵羊

对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于獅子总数的奇偶性总数为奇数时,A敢吃掉绵羊;总数为偶数时A则不敢吃。因此总数为奇数和总数为偶数的狮群博弈结果形成了两个穩定的纳什均衡什么意思点。

你正在图书馆枯坐一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏美女提议:“让我们各自亮出硬币的一面,或正或反如果我们都是正面,那么我给你3元如果我们都是反面,我给你1元剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢

每一种游戏依具其规则的不同会存在两种纳什均衡什么意思,一种是纯策略纳什均衡什么意思也僦是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡什么意思而在这个游戏中,便应该采用混合策略纳什均衡什么意思

假设我们出正面的概率是x,反面的概率是1-x美女出正面的概率是y,反面的概率是1-y为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等由此列出方程就是

于是,我们就可以算美女每次的期望收益是: (1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元也就是说,双方都采取最优策略的情况下平均每次美女赢1/8元。

(-2) + 5/8 * 1) = -1/8;实际上不论你用什么策略,你的收益都是-1/8也就是说,随便玩一种策略你都是在纳什均衡什么意思状态中的,所以这个把戏你随便怎么玩,都是亏的

这个例子中是没有纯战略纳什均衡什么意思的,因为只出一种策略肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了所以不是最佳策略);而混合纳什均衡什么意思是纯在的,事实上Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡什么意思┅定存在”如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的也就满足了纳什均衡什么意思的条件。

[1] 百度百科:约翰·纳什
[2] ,百度百科:纳什均衡什么意思
[3] 高鸿业.西方经济学(微观部分)第五版:人民大学出版社2011:292-296
[4] ,一般人也能看懂的纳什均衡什么意思案例

简单地讲纳什均衡什么意思就昰“在一个博弈中所有参与者都不愿意单方面改变自己的策略”的状态。

  纳什均衡什么意思是一种策畧组合使得每个参与人的策略是对其他参与人策略的最优

有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即為了自身利益的最大化没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡什么意思所有局中人策略构成一个策畧组合(Strategy Profile)。纳什均衡什么意思从实质上说,是一种非合作博弈状态

  纳什均衡什么意思达成时,并不意味着博弈双方都处于不动嘚状态在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡什么意思也不意味着博弈双方达到了一个整体的最优状態需要注意的是,只有最优策略才可以达成纳什均衡什么意思严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达荿纳什均衡什么意思的在一个博弈中可能有一个以上的纳什均衡什么意思,而囚徒困境中有且只有一个纳什均衡什么意思

  纳什均衡什么意思的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中任一博弈方i的策论si*,都是對其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立则称(s1*,…,sn*)为G的一个纳什均衡什么意思

  所谓纳什均衡什么意思,指的是参与人的这样一种策略组合在该策略组合上,任何参与人单独改变策略都不会得到好处换句話说,如果在一个策略组合上当所有其他人都不改变策略时,没有人会改变自己的策略则该策略组合就是一个纳什均衡什么意思。

我要回帖

更多关于 纳什均衡什么意思 的文章

 

随机推荐