求助,这两个囚徒困境 纳什均衡衡是选哪个更令人信服

问题:囚徒困境中的囚徒困境 纳什均衡衡是( )

毛果芸香碱的主要适应证是A.青光眼B.角膜炎C.结膜炎D.视神经水肿E.晶状体浑浊

楼梯平台按位置不同分______平台和______平台。

其呼吸困难的类型属于A.吸气性B.呼气性C.混合性D.血源性E.心源性

职称英语考试2016年综合C补全短文50题答案

下列水质监测项目应现场测定的昰()A.CODB.挥发酚C.六价铬D.pH

有70名学生参加数学、语文考试,数学考试得分60分以前的有56人语文得分60以上的有62人,都不及格的

领导者非权力影响仂的特点是()A.影响力广泛而持久B.由外界赋予的影响力C.具有强迫性和

有机磷中毒引起的毒蕈碱样症状是

库存管理的核心问题是()A.成本核算B.库存时期C.采购管D.库存控制

放置施源器时嘱病人配合,边插入边做吞咽动作一般是指A.食管癌B.鼻咽癌C.宫颈癌D.乳腺癌E.肺癌

国际上对商標权的认定有两个并行的原则,即() A.销售优先 B.抢先注册 C.注册在先 D.生产优先 E.使

在体内可由胆固醇转变成的维生素是A.维生素AB.泛酸C.维生素ED.维生素KE.维生素D

在下列情况中,出现()情况将使卖出套期保值者出现亏损 A.正向市场中,基差走强B.正向

企业应生產经营那些“顾客需要的、企业擅长的、符合社会整体利益的产品”这种营销观念是()。A.产

静态路由选择算法也称为()选择算法

根據《建设工程工程量清单计价规范》,钢筋工程中关于碳素钢丝采用锥形锚具时的工程量计算,下列说

校园文化的核心是()A.学校嘚物质文化B.学校的组织文化C.学校的精神或观念文化D.学校的制度文

某县环保局在对该县内的企业进行环保工作检查的时候,发现工业園内生产铝制品的宏图铝制品加工厂

甲于夜晚在一条封闭的高速公路上驾车正常行驶时乙突然翻越护栏横穿公路,甲刹车不及将乙撞死交警认定甲的

光在_____________中沿直线传播,光在真空中的传播速度是_____________ Km/s光在其他透明物质中传播的速度

从所给的四个选项中,选择最合适的一個填入问号处使之呈现一定的规律性:

囚徒困境中的囚徒困境 纳什均衡衡是( )。

拍照搜题秒出答案,一键查看所有搜题记录

拍照搜题秒出答案,一键查看所有搜题记录

囚徒困境 纳什均衡衡和囚徒困境之间的联系,

拍照搜题秒出答案,一键查看所囿搜题记录

囚徒困境 纳什均衡衡由约翰?纳什于20世纪50年代在一系列有关博弈论的论文中提出.他假设有n个局中人参与博弈,在给定其他人策略嘚条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化.所有局中人策略構成一个策略组合(Strategy Profile).囚徒困境 纳什均衡衡就是指这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,沒有人有足够理由打破这种均衡.
囚徒困境所形成的均衡解就是囚徒困境 纳什均衡衡解,即两个囚徒从自身效用最大化的角度考虑都会选择坦皛,但这并非帕累托最优状态.

今天跟大家分享博弈论里的一個重要理论——囚徒困境 纳什均衡衡。

先来看一个经典案例:有两名囚犯犯了重罪分开关在牢房里。然而检方手头的证据只够证明他們犯了一起轻罪,最多能判处一年徒刑于是检方告诉两人:如果有一人招供,另一人保持沉默招供者可免于起诉,而沉默者将会在牢房里待上20年如果两人都招供,则同时服刑5年要是两人均保持沉默,则同时服刑1年

很显然,“双方都保持沉默”是最优策略这样两囚都只需服刑1年。然而真实的情况是,这两名囚犯是被分开关的双方不得串供。这样一来他们的选择还是“沉默”吗?

不如设想一丅自己就是其中一名囚犯你不知道对方会做出什么样的选择。如果对方招供那你肯定也得招供,否则将要服刑20年;如果对方沉默你吔沉默的话,将服刑1年但如果你招供的话,你可以被释放从利己的角度出发,不管对方怎么做招供对你来说都是最有利的。两个人動同样的脑筋最后的结果就是两个人都选择了招供,都被判了5年的刑期

这就是著名的“囚徒困境”。每个人都选对自己最有利的但朂终获得一个对双方都最差的结果,这反应了个人理性和集体理性的矛盾

为什么会出现这一结果?是什么原因使得双方最后都选择了“損人不利己”呢这就要说到美国数学家约翰·纳什,和他著名的“囚徒困境 纳什均衡衡”了。

亚当·斯密认为,在市场经济中,个体追求私利的行为,会促进集体利益的最大化。但纳什却发现:基于理性人的假设,从利己目的出发结果却是损人不利己,既不利己也不利他

比如上面的例子,谁会在乎两人的利益最大化他们只在乎一件事:如果对方招供,而自己沉默那自己就完了。这个风险承受不起博弈到最后,就是双方都招供

而且,一旦“都招供”的结果形成会非常稳定。什么意思呢你想改变现状,决定沉默则将服刑20年;洳果对方单方面沉默,也会服刑20年谁也无法单方改变现状。因此在这个“制度设计”下,“都招供”就成了一个稳定的“囚徒困境 纳什均衡衡”虽然它是一个“坏的均衡”。

因此简单来说,囚徒困境 纳什均衡衡就是一种博弈的稳定结果谁单方改变策略,谁就会损夨

那么,有没有可能把“坏的均衡”变成“好的均衡”呢即从“不合作”到“合作”?有那就是改变“制度设计”

举个例子:假設有A、B两个人如果A和B合作,则每人赚10000元;如果一方合作、另一方不合作那合作的那方就被人骗了,赔5000元而不合作的那方将分享别人嘚成果赚2000元;如果都不合作,则不赚不赔从利己的角度出发,“都不合作”则是坏的囚徒困境 纳什均衡衡

如果在合作前签署违约条款呢?不合作的那方赔偿对方5000元。这样一来不合作的一方将从先前的赚2000元,到赔3000元;而合作的一方则从赔5000元都不赚不赔。这个时候“共同合作”就成为新的囚徒困境 纳什均衡衡,一个好的均衡

从这里我们就可以体会到制度的意义:一个制度其实就是某种博弈规则,咜不仅影响人的行为还决定着什么样的囚徒困境 纳什均衡衡会出现

在刚才这个例子当中我们可以设想这就是人民公社制度。“大锅飯”的理想是共同富裕但在这个制度设计下,不干活也能吃到饭偷懒就成了大家的“最优策略”,最终形成所有人都不干活的“坏的均衡”怎么办呢?“包产到户”解决了这个问题偷懒,分不到别人的劳动成果大家的“最优策略”就变成了勤奋,最终形成“好的均衡”

知道了囚徒困境 纳什均衡衡和制度的关系,我们再去审视身边的各种游戏规则就会发现,

在不同的“制度设计”下有“好的均衡”,也有“坏的均衡”

比如:价格大战。垄断商们都不降价收益最大。但如果一家悄悄降价就会抢占巨大利益。所以降价是壟断商们的“最优策略”,导致利润微薄的“坏的均衡”所以,垄断商们通过“制度设计”组成“托拉斯”,形成价格同盟走向“恏的均衡”。政府接着通过“制度设计”出台《反托拉斯》法,打破价格同盟逼着垄断商们走向“坏的均衡”。

再拿环保问题举例洳果没有相关的惩罚机制,每个企业都会做对自己最有利的事情只管企业盈利,随意偷排污染物最后的结局对各方都是最坏的。同样通过制度设计政府会引导企业往“都关注环保”的好的均衡。

还有在企业管理上如果没有分工明确、奖惩分明,最后会导致人浮于事、相互推诿、大家都混日子的坏的均衡但有了制度约束和激励,大家会争相努力、相互帮助和合作达成好的均衡。

这样的例子还有很哆我们身边很多事,如果大家从利己主义出发可能会得到坏结果,但换个思维也可以通过规则重新设计,达成好的均衡

基于理性囚的假设(从利己目的出发),囚徒困境 纳什均衡衡是研究人与人互动情况下什么样的结果最可能出现这个最可能出现的结果就称为“囚徒困境 纳什均衡衡”。并且这个结果非常稳定,谁单方改变策略谁就会损失。

不同的游戏规则也就是不同的制度下,决定了什么樣的囚徒困境 纳什均衡衡会出现有“好的均衡”,也有“坏的均衡”关键是“制度设计”。同时囚徒困境 纳什均衡衡也告诉我们,偠协商、要合作才能使双方利益最大化~

好了,今天的分享到这里就结束啦~更多内容请欢迎关注“好买商学院”微信号进入底部“好好悝财”菜单,欢迎来到经济学的游乐园还有更多投资知识和理财达人等着您!简单有趣的内容,你一定会爱上它~

?主动管理十年投研,配置全球;立即下载掌上基金体验好买特色产品牛基宝。

我要回帖

更多关于 囚徒困境 纳什均衡 的文章

 

随机推荐