第一件纳什的老婆生了黑人没人觉得鸡肋吗

篮球鞋 | 电子竞技 | 梅西(lionelmessi) | 自行车运动 | 日本文化 | 机械 | 德国足球甲级联赛 | 宠物医生 | 中国足球 | 用户界面设计师 | 滑雪 | 自行车选购 | acg | 高考志愿 | 国家队 | 汽车购买 | 运动损伤 | 欧美明星 | 设计 | 大数据 | 肖战 | 中药 | 哲学 | 直播 | 3D | 电视节目 | 理科 | 欧洲 | NBA 2K | 拜仁慕尼黑足球俱乐部 | ps4 | 捷安特 | 大学专业 | 巴塞罗那足球俱乐部 | 香港购物 | 玄幻小说 | 跑鞋 | pmp | 欧洲冠军联赛 | 土拨鼠 | aj1 | 牙齿 | 尤文图斯 | 女同性恋 | 天气 | 口臭 | 足球鞋 | 户外运动 | 少帅 | 亲子鉴定 | 配音 | 角色扮演 | 手机游戏 | 旅游线路 | 郭德纲 | 旅游推荐 | 梦想改造家 | 中学 | 北京国安 | ISIS（伊斯兰国） | 一级方程式赛车（f1） | iPhone | 拼多多 | 户外 | 罗兰 | 中国 | 电源 | 金蝶 | 百度知道 | 用户界面设计 | 女排 | 城市 | 电脑 | QQ音乐 | 复仇者联盟（电影） | 室内设计 | 政府 | 人生 | 三国杀 | 韩国旅游 | 微博 | 有机化学 | 我的世界（minecraft） | 鉴定 | 汽车维修 | 戚继光 | 古汉语 | akb48 | 科幻小说 | 建筑设计 | 梵蒂冈 | 张帅 | 完美世界（游戏） | 电吉他 | 北京 | 眼镜 | 昆山 | 美容护肤 | 足球规则 | 多肉植物 | 荷兰 | macos | 昌平区 | 对联 | 曼彻斯特联 | 南京 | 实况足球（游戏） | 鹿晗 | 新闻 | 西藏大学 | 貂蝉 | 湖北 | 网易 | 借记卡 | 剧场版 | 安踏体育 | 网球王子 | 住宅风水 | 汉语 | 广播体操 | 营销策划 | 用户界面 | 武侠小说 | 汽车改装 | 张璐 | 高三 | 海军工程大学 | 诗歌 | 富平县 | 盗墓笔记（小说） | 高速公路 | 青年旅舍 | 离婚 | 相声演员 | 阿迪达斯(adidas) | 中国足球协会超级联赛（csl） | 烹饪学校 | 婚纱照 | 发烧 | 流星花园 | 动车 | 赚钱 | 爱奇艺 | 铜陵市 | 澳大利亚 | 头发 | 环境保护 | 跑步爱好者 | 后宫·甄嬛传（书籍） | 书法 | #全民答题# | 阿迪达斯 | 外星人 | 象棋 | 牛皮癣 | 动画电影 | 眼睛 | 平面设计 | 运动会 | adidas阿迪达斯 | 诸葛亮 | 云南旅游 | 巴黎 | 少数民族 | 云南 | 小品 | 跑步鞋 | 性价比 | 减脂 | 巴西 | 葡萄酒 | 非洲 | 考研 | 美容 | 张继科 | 挖掘机 | 红酒 | 淘宝网 | 战斗机 | 郭富城 | 曼彻斯特联（Manchester United） | 音乐剧 | 年会 | 易烊千玺 | 骨折 | 传统武术 | 模特 | 平板电脑 | 家用电器 | 华为手机 | 双眼皮手术 | 钢笔 | 娱乐圈 | 游泳馆 | 腾讯产品 | 法国足球甲级联赛 | 趣味 | 身高 | 日语歌曲 | 支付宝 |

你的位置：网站首页 >> 频道首页 >>体育运动 >>第一件纳什的老婆生了黑人没人觉得鸡肋吗

第一件纳什的老婆生了黑人没人觉得鸡肋吗

来源：蜘蛛抓取(WebSpider) 时间：2017-08-05 00:18 标签：纳什孩子黑人

奇数定理：&b&几乎所有&/b&有限策略博弈都有奇数个纳什均衡。
奇数定理：几乎所有有限策略博弈都有奇数个纳什均衡。
部分电影情节与其说不相符，不如说是艺术再造中省略了一部分真实或者填充了一部分未知。我最明显的观察是电影情节与真实相符的部分，尤其是前半部分：&br&&br&1）在普林斯顿读书时的确不怎么去上课，整天憋着要想出自己的original idea. 除了不上课，纳什也几乎不读什么专业著作，他认为阅读别人的成果会阻碍自己的创造力。&br&&br&2）电影中的系主任和Martin在现实中都有原型，性格勾画也与原型很符合。&br&&br&3）纳什经常自言自语，语言表达也很不连贯，曾经和爱因斯坦见过面讨论他关于相对论的想法，所以电影里会有他对系主任要求“arrange one more appointment with Einstein.&&br&&br&4）纳什是那种一切靠心算的天才，学生时代老师在黑板上出题目他就是不动笔盯着看，和电影里去military base解码的风格一样。&br&&br&5）纳什和Alicia第一次见面的场景是真实的。当时纳什走进教室，第一件事就是把窗全关了，Alicia再去全部打开。&br&&br&6）纳什经常爱咬着一个空的纸杯子，就像电影里Alicia去办公室找他时一样。&br&&br&7）纳什非常热衷数字学和黎曼假设。&br&&br&8）他精神分裂幻觉的一大部分和国际政治有关，认为自己在执行宇宙神秘力量赋予的秘密任务。和电影中Parcher的故事线体现的中心思想差不多。&br&&br&9）他发疯后期在普林斯顿校园里出没时，时常有年轻学生会公然嘲笑他。&br&&br&10）他老年时每天都去图书馆，大多数时间都是一个人，曾和一位伊朗学生有过交谈。
部分电影情节与其说不相符，不如说是艺术再造中省略了一部分真实或者填充了一部分未知。我最明显的观察是电影情节与真实相符的部分，尤其是前半部分： 1）在普林斯顿读书时的确不怎么去上课，整天憋着要想出自己的original idea. 除了不上课，纳什也几乎不…
这个是经济学里，尤其是微观经济学需求理论里经常碰到的Berge's maximum theorem的推论：&br&&br&&b&Berge's maximum theorem：&/b&给定一个带参数的最优化问题&img src=&///equation?tex=%5Cmax_%7Bz+%5Cin+A%28%5Ctheta%29+%7DF%28z%2C+%5Ctheta%29& alt=&\max_{z \in A(\theta) }F(z, \theta)& eeimg=&1&&&br&满足：&br&&ol&&li&多值函数&img src=&///equation?tex=%5Ctheta+%5CRightarrow+A%28%5Ctheta%29& alt=&\theta \Rightarrow A(\theta)& eeimg=&1&& 是连续的，且&img src=&///equation?tex=A%28%5Ctheta%29& alt=&A(\theta)& eeimg=&1&&是紧致的。&br&&/li&&li&函数&img src=&///equation?tex=%28z%2C+%5Ctheta%29+%5Cmapsto+F%28z%2C+%5Ctheta%29+& alt=&(z, \theta) \mapsto F(z, \theta) & eeimg=&1&&是连续的&br&&/li&&/ol&则&img src=&///equation?tex=%5Ctheta+%5Cmapsto+%5Cmax_%7Bz+%5Cin+A%28%5Ctheta%29+%7DF%28z%2C+%5Ctheta%29& alt=&\theta \mapsto \max_{z \in A(\theta) }F(z, \theta)& eeimg=&1&&是连续的，而多值函数&img src=&///equation?tex=%5Ctheta+++%5CRightarrow+%5Coperatorname%7Bargmax%7D_%7BA%28%5Ctheta%29%7DF%28%5Ccdot%2C+%5Ctheta%29& alt=&\theta
\Rightarrow \operatorname{argmax}_{A(\theta)}F(\cdot, \theta)& eeimg=&1&&是上半连续的&br&&br&这里&img src=&///equation?tex=%5Ctheta& alt=&\theta& eeimg=&1&&对应其他人选择的策略&img src=&///equation?tex=%5Csigma_%7B-i%7D& alt=&\sigma_{-i}& eeimg=&1&&, 而&img src=&///equation?tex=A%28%5Ctheta%29+%3D+%E3%80%81%28A_i%29& alt=&A(\theta) = 、(A_i)& eeimg=&1&&对应一个常多值函数。&br&所以&img src=&///equation?tex=%5Csigma_%7B-i%7D+++%5CRightarrow+%5Coperatorname%7Bargmax%7D_%7B%E3%80%81%28A_i%29%7Du_i%28%5Ccdot%2C+%5Csigma_%7B-i%7D+%29& alt=&\sigma_{-i}
\Rightarrow \operatorname{argmax}_{、(A_i)}u_i(\cdot, \sigma_{-i} )& eeimg=&1&&是上半连续的。
这个是经济学里，尤其是微观经济学需求理论里经常碰到的Berge's maximum theorem的推论： Berge's maximum theorem：给定一个带参数的最优化问题\max_{z \in A(\theta) }F(z, \theta) 满足：多值函数\theta \Rightarrow A(\theta) 是连续的，且A(\theta)是…
在拓展式博弈(extensive form)中，NE和SPE的区别在于威胁是否可信。&br&&br&比如最经典的行业进入博弈：&br&B选择不进入(2,1)&br&B选择进入&br&- A选择竞争(0,0)&br&- A选择默许(1,2)&br&&br&NE有两个：（默许，进入）和（竞争，不进入）&br&SPE只有一个：（默许，进入）&br&&br&我们来观察一下（竞争，不进入）这个NE而非SPE，其潜在的假设是，无论B选择什么，A一定选择竞争（即NE所要求的&b&单方面偏离&/b&），我们可以认为这是A在一开始提出的&b&威胁&/b&，迫使B选择不进入。&br&但是这个&b&威胁&/b&是&b&不可信&/b&的（在没有其它附加条件的情况下），因为A在B之后进行选择，如果B已经选择了进入，A选择默许比选择竞争更优。
在拓展式博弈(extensive form)中，NE和SPE的区别在于威胁是否可信。比如最经典的行业进入博弈： B选择不进入(2,1) B选择进入 - A选择竞争(0,0) - A选择默许(1,2) NE有两个：（默许，进入）和（竞争，不进入） SPE只有一个：（默许，进入）我们来观察一下…
谢邀，很激动~&br&&br&首先得向纳什的逝世表示哀悼啊，因为博弈论对现代经济学的影响实在是太大了。&br&&br&数学修为比较低，无法评论纳什数学方面的成就。&br&&br&经济学方面来讲，说他是有史以来最伟大的经济学家之一也不为过。纳什对于博弈论的分析彻底改变了经济学的分析方法。无论是古典经济学还是新古典经济学，其实一直都没有解决人与人的互动问题（其实说到本质是如何通过对他人决策的推测做出最优于自己的决策）。博弈论的出现给很多涉及策略性行为的情况提供了理论基础，比如这个问题：&a href=&/question/& class=&internal&&为什么麦当劳和肯德基总是开在一起？ - 经济学&/a&，再比如劳动力市场中的集体议价模型，公共品提供，产业结构（寡头垄断模型等），不对称信息等等（省略n多字）。可以说博弈论大大扩展了经济学可以分析的内容。&br&&br&当然博弈论本身给新古典理论带来了非常大的挑战，就是单次囚徒困境博弈的合作解问题（也可以理解成单次博弈中的合作问题）。根据经典的博弈论理论，单次囚徒困境不可能达到合作解（这就意味着充满单次商品交易的新古典经济学是达不到最优解的），但是在现实生活中和大量心理学实验都证明合作解的广泛存在。Ostrom（2009年的诺贝尔经济学奖得主）就致力于分析在相对封闭环境下，小规模人类社会如何解决公有资源的有效使用问题。其他还有脑科学，心理学研究试图揭露人类倾向合作的心理学机制（&a href=&/question//answer/& class=&internal&&这个关于分配财富的博弈论模型试验有什么心理学解释？ - Zhi Li 的回答&/a&）。&br&&br&由于纳什的分析框架实际上是一种全新的方法（纯粹数学的，和经济学理论本身没什么关系），所以在经济学之外也有广泛的应用。约翰·梅纳德·史密斯的《演化与博弈论》就是把博弈论拓展到生物学研究的经典著作。政治学不是特别了解，但是集体行动的分析应该也离不开博弈论的分析。
谢邀，很激动~ 首先得向纳什的逝世表示哀悼啊，因为博弈论对现代经济学的影响实在是太大了。数学修为比较低，无法评论纳什数学方面的成就。经济学方面来讲，说他是有史以来最伟大的经济学家之一也不为过。纳什对于博弈论的分析彻底改变了经济学的分析方法…
靠右走。&br&不许靠右吗？&br&那就挑俩粪桶吧。
靠右走。不许靠右吗？那就挑俩粪桶吧。
题主的观点是错误的。纳什在患病后仍然取得了极高的成就；纳什的某些成果或许没有发表；纳什的研究领域不容易出成果；纳什的一些成果，常人不理解也看不懂，通常不会出现在报道中。&br&&br&1.纳什在患病之后仍取得了卓越的成就。纳什在晚年对偏微分方程的研究成果，使他获得了2015年的阿贝尔奖，但可惜的是，他在领奖的归途中遭遇车祸，不幸身亡。阿贝尔奖是数学领域的三大奖之一，三大奖分别为菲尔兹奖、阿贝尔奖、沃尔夫奖。菲尔兹奖只颁发给40岁以下的研究者，故纳什无缘菲尔兹奖。这足以说明，纳什在晚年仍取得了极高的成就。&br&&br&2.纳什的某些成果，或因为其并不完美，存在缺陷，本人对此不满意而没有发表。某些过于追求完美的数学家通常不会发表“半成品”，例如，对某个数学难题的解答，依赖于另一个尚未解决的数学难题；又或者是，解答过程中的某一个公式无法证明。无论多么接近最终的答案，只要存在一丝缺陷，就可能被尘封。而有时候，仅仅因为数学家不相信自己所得出的结论，亦不会发表——高斯曾在理论上推导出非欧几何，但他不相信自己所得出的结论，于是没有发表。或许，后人会从纳什的遗物中发现某张写满了公式的稿纸，上面竟记载了某个难题巧妙的解答......&br&&br&3.纳什的研究领域是数学中较难的领域，无论是他曾试图破解的哥德巴赫猜想，亦或是后来的偏微分方程，都不容易出成果。伟大的数学家欧拉穷极一生也没有破解哥德巴赫猜想，但毕竟证明了某些方法在这条路上是行不通的。若你要求纳什对哥德巴赫猜想做出突出贡献，那他这一生也未免太传奇了——多少数学家失败了，他只不过是其中之一；倘若他成功了，那他就具有非凡的地位——别对人家要求那么高嘛！&br&&br&4.数学家的多数成果，对于非数学研究者而言，是根本看不懂的，完完全全的看不懂，根本不知道它是干什么的，也不知道有什么意义，更不清楚为什么要研究它，比哲学和神学都要玄乎，因此媒体不会报道，你也不了解。大家都知道“上帝粒子”拿了诺贝尔奖，要是你花十分钟去了解它，好歹你能知道它是一种“粒子”，或许还能了解“大一统理论”。但我相信你不会理解多数数学成果，我举个例子，你知道黎曼猜想是什么吗？给你一个月的时间，你能理解黎曼猜想有什么意义吗？这显然是不可能的。即使是数学本专业学生，多数也弄不明白，因为数学实在太难了。如果仅仅因为你看不懂纳什的成果而说晚年的纳什成果寥寥，那是错误的，事实上晚年的纳什还在发表论文。&br&&br&综上所述，答主的看法是错误的，完完全全错误的。
题主的观点是错误的。纳什在患病后仍然取得了极高的成就；纳什的某些成果或许没有发表；纳什的研究领域不容易出成果；纳什的一些成果，常人不理解也看不懂，通常不会出现在报道中。 1.纳什在患病之后仍取得了卓越的成就。纳什在晚年对偏微分方程的研究成果…
明确反对楼上答案。使用博弈论的前提是决策双方都是理性的。而实际的情况是，美国和苏联作为两个国家，在古巴导弹危机前后美苏双方的决策并不是理性决策。详见：决策的本质：解释古巴导弹危机（第2版）[Essence of Decision Explaining the Cuban Missile Crisis 2nd Edition] [美] 格雷厄姆·阿利森（Graham T.Allison），菲利普·泽利科（Philip Zelikow）著。
明确反对楼上答案。使用博弈论的前提是决策双方都是理性的。而实际的情况是，美国和苏联作为两个国家，在古巴导弹危机前后美苏双方的决策并不是理性决策。详见：决策的本质：解释古巴导弹危机（第2版）[Essence of Decision Explaining the Cuban Missile C…
因为混合策略纳什均衡就是两个参与人最优的混合策略组合。&br&这么说好像很难直接get到，我推导一下？&br&&br&&br&混合策略和纯策略不同，前者的概率性偏大，并不是明确唯一的，而是一种策略空间上的概率性分布。（纯策略可以看成是混合策略的极端：选择这一个策略概率为100%，其余的策略方案概率为0%）混合策略是通过博弈双方的混合策略构成纳什均衡。&br&&br&纳什均衡就是要使同一时间内每个参与人的策略是对其他参与人策略的最优反应。这么推断下来，定义就给出了要考虑对方收益啊……？&br&【或者你百度一下，定义是“面对其他博弈者选择的不确定性的一个理性对策，其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值，否则，一个博弈者会选择那个期望值最高的策略而排除所有其他策略，这意味着原初的状态不是一个均衡。” 不考虑对方期望值和收益的话，说不定博弈在开始就是崩的，根本没必要】&br&&br&--------------------------------------------分割线-----------------------------------------------------------&br&前面是纯粹靠定义推断，我举个例子吧&br&比方企业和税收局。&br&对于企业来说，偷税漏税无疑是最优方案，可是如果只考虑自己的收益，就会遗漏税收局的查税。对于税收局来说查出漏税企业或许是最优方案，所以这种情况下难道不考虑对方收益吗。&br&反之亦然，对于税收局来说，最优方案就是不查税，查一次耗时耗力太烦了。但是只考虑自己的最优方案，那么肯定会有企业漏税。&br&&br&（那么双方在这种情况下的最优选择，就是随机。&br&你随你的我随我的。）&br&&br&也不知道解答了没有(//^\\..)
因为混合策略纳什均衡就是两个参与人最优的混合策略组合。这么说好像很难直接get到，我推导一下？混合策略和纯策略不同，前者的概率性偏大，并不是明确唯一的，而是一种策略空间上的概率性分布。（纯策略可以看成是混合策略的极端：选择这一个策略概率为1…
这个题目不错。&/p&&p&
在对称二人博弈下，如果每个人都只有两个策略，那么这个结论是成立的。&/p&&p&比如说有两个人，小明和小红。小明可以选上和下，小红可以选左和右。支付矩阵是&br&a b&br&c d&/p&&p&
现在设，（上，左）是唯一的纯策略纳什均衡。于是我们可以推出：&img src=&///equation?tex=a%5Cgeq+b%2C+a%5Cgeq+c& alt=&a\geq b, a\geq c& eeimg=&1&&。&/p&&p&
然后，有一个混合策略均衡：小明以&img src=&///equation?tex=p& alt=&p& eeimg=&1&&的概率选上，小红以&img src=&///equation?tex=q& alt=&q& eeimg=&1&&的概率选左。如果两个混合策略都是退化的，那就退回纯策略了，所以至少有个人不是。因为两个人是对称的，不妨设小明的混合策略是非退化的，即&img src=&///equation?tex=0%3Cp%3C1& alt=&0&p&1& eeimg=&1&&。&/p&&p&
第一种情形，小红的策略完全退化到左，即&img src=&///equation?tex=q%3D1& alt=&q=1& eeimg=&1&&。小明选择混合策略，说明他在两个策略下的支付是一样的，不然就会选择支付更大的那个策略，这样就推出了&img src=&///equation?tex=a%3Dc& alt=&a=c& eeimg=&1&&。于是对于左，下也是最优反应。由于要求（下，左）不是纳什均衡，所以左绝对不能是下的最优反应，推出&img src=&///equation?tex=c%3Cd& alt=&c&d& eeimg=&1&&。结合前面的&img src=&///equation?tex=a%5Cgeq+b%2Ca%3Dc& alt=&a\geq b,a=c& eeimg=&1&&，得出&img src=&///equation?tex=d%3Eb& alt=&d&b& eeimg=&1&&。所以（下，右）是纳什均衡，矛盾。&/p&&p&
然后考虑其他情形。小明选上得到&img src=&///equation?tex=qa%2B%281-q%29b& alt=&qa+(1-q)b& eeimg=&1&&，选下得到&img src=&///equation?tex=qc%2B%281-q%29d& alt=&qc+(1-q)d& eeimg=&1&&。前面说了，混合策略纳什均衡的性质是这两个要相等。然而&img src=&///equation?tex=a%5Cgeq+c& alt=&a\geq c& eeimg=&1&&，要让这两个相等必须有&img src=&///equation?tex=d%5Cgeq+b& alt=&d\geq b& eeimg=&1&&。然后再看小红，选左得&img src=&///equation?tex=pa%2B%281-p%29c& alt=&pa+(1-p)c& eeimg=&1&&，选右得&img src=&///equation?tex=pb%2B%281-p%29d& alt=&pb+(1-p)d& eeimg=&1&&。，要让这两个相等必须有&img src=&///equation?tex=d%5Cgeq+c& alt=&d\geq c& eeimg=&1&&。所以（下，右）是纳什均衡，矛盾。&/p&&p&
证毕。&/p&&p&
但是多人博弈就没这么容易推了，应该不成立。如果还是二人博弈，但有人的策略数至少3个呢？显然由这个推理就可知，只要有混合策略以0的概率取纳什均衡策略就行了。这就是 &a class=&member_mention& href=&///people/a1cbfe9de8ea4ba3ea77f7& data-hash=&a1cbfe9de8ea4ba3ea77f7& data-hovercard=&p$b$a1cbfe9de8ea4ba3ea77f7&&@晓风残月&/a&举的反例。&/p&
这个题目不错。在对称二人博弈下，如果每个人都只有两个策略，那么这个结论是成立的。比如说有两个人，小明和小红。小明可以选上和下，小红可以选左和右。支付矩阵是 a b c d 现在设，（上，左）是唯一的纯策略纳什均衡。于是我们可以推出：a\geq b, a\geq…
谢邀 &a data-hash=&330a0fdf5c827ebf83fb1faf& href=&///people/330a0fdf5c827ebf83fb1faf& class=&member_mention& data-hovercard=&p$b$330a0fdf5c827ebf83fb1faf&&@阿空&/a&&br&1. &br&首先需要指出，“纳什均衡不一定是最优解”中，最优的含义是“帕累托最优”：不可能提高一个人的利益而不损害另一个人的利益。“自己能选择的最优策略”中，最优的含义是“自身效用或者说自身利益最大化”，这两个最优的含义并不完全相同。&br&其次，你说“为什么不直接求解自己策略中的最优策略”，这是因为博弈论的关键就在于这是“interactive”的&br&我们考虑一个翻硬币问题，你和朋友A各拿一枚硬币，各自独立地决定是出字还是出花。如果两个人的选择相同，你获胜，如果选择不同，A获胜。这时候，你并不存在“最优策略”，不管你出什么，你都是既有可能赢也有可能输，这是因为你最后是赢还是输不是你独自决定的。&br&（当然，有些博弈中存在单方面的“最优策略”，这种策略叫作“占优策略”）&br&&br&2. &br&纳什均衡只是给出了一种可能的“稳定”的解。&br&实际上，如果有多于一个纳什均衡，我们也无法说明这个博弈如果真的进行的话会达成哪一种均衡；甚至有可能双方各遵循了不同的均衡。&br&你可以把它理解为一种稳定状态，但是如何达成这种稳定状态，经济学家仍然在研究中。
1. 首先需要指出，“纳什均衡不一定是最优解”中，最优的含义是“帕累托最优”：不可能提高一个人的利益而不损害另一个人的利益。“自己能选择的最优策略”中，最优的含义是“自身效用或者说自身利益最大化”，这两个最优的含义并不完全相同。 …
这里说一下博弈论里出现的均衡概念吧。标准式博弈里的均衡请看另一个答案&a href=&/question//answer/& class=&internal&&如何理解相关均衡？ - 知乎用户的回答&/a&，这里写的都是拓展式博弈相关的。&br&&br&标准式博弈和拓展式博弈的区别：直观上一个描述静态博弈、一个描述动态博弈；不过我觉得本质上，前者的一个strategy就等于一个action，后者的strategy可以包含多个actions。&br&&br&标准式博弈里出现的概念：占有策略均衡（DSE）纳什均衡（NE）、混合策略纳什均衡（MSNE）、相关均衡（CE），关系是CE包含MSNE包含NE包含DSE。&br&&br&拓展式博弈里出现的均衡概念：子博弈完美纳什均衡（Subgame Perfect Equilibrium，SPE），完美贝叶斯均衡（Perfect Bayes Equilibrium，PBE），序贯均衡（Sequential Equilibrium，SE），颤抖手均衡（Trembling Hand Perfect Equilibrium，PE）。&完美&也可以翻译成&精炼&。他们和纳什均衡（NE）的关系是：NE包含SPE包含PBE包含SE包含PE。&br&&br&============ 4月7日更 ===========&br&&br&----------------SPE和NE的关系----------------&br&&br&SPE的定义：一个策略组合，其中每个参与人的策略在原博弈上，和轮到他行动的每个子博弈上，都是NE。因为它是原博弈的一个NE，故所有SPE都是NE。&br&&br&但是并非所有NE都是SPE。考虑性别战（battle of sex）博弈，有两个纯策略NE（歌剧，歌剧）和（球赛、球赛）。但如果丈夫先于妻子选择，则（球赛，球赛）是唯一的纯策略SPE。&br&&br&为什么（歌剧，歌剧）不是SPE呢？在SPE中，妻子在第二步的子博弈里行动，当给定丈夫的选择，她的选择必须是对丈夫选择的最优反应——根据前面的两个NE，丈夫选什么妻子就选什么。如果丈夫知道这一点，他就一定会选择球赛（拿到高效用）而非歌剧（拿到低效用）。丈夫根本不必担心自己如果&自私&地选了球赛妻子会选歌剧报复他，因为按照SPE的要求，妻子也不傻，一起看球赛虽然不是她最喜欢的，但总比各看各的好。&br&&br&同理，如果改成妻子先选择，那唯一的纯策略SPE就是（歌剧，歌剧）了。但总的来说，在性别战里每个SPE都是NE，但总有一个NE不是SPE。&br&&br&需要注意的一点是，SPE策略组合需要给每个节点都赋一个行动，即是这个节点不在均衡路径上。&br&在上述SPE中我们看到的博弈结果是丈夫选择(球赛)，妻子选择(球赛)，而一个完整的SPE应当是：丈夫选球赛；妻子选球赛（若丈夫选球赛），选歌剧（若丈夫选歌剧）。即是妻子知道丈夫不可能选歌剧，但她还是要做预案——对于丈夫选了歌剧之后的这个子博弈，尽管在均衡路径之外不对均衡结果造成影响，SPE里仍然要求声明对它的NE。&br&&br&习题：考虑一个三阶段的性别战博弈：第一阶段丈夫选歌剧或球赛，第二阶段妻子看到丈夫的选择选歌剧或球赛，第三阶段如果夫妻选择一致则博弈结束，如果选择不一致则丈夫选择&各看各的&和&吵架&。这里的均衡结果看上去和上一个一样，但SPE需要声明的路径之外的节点就更多了：丈夫的选择（第一节点：球赛；第三节点：各看各的），妻子的选择（第二节点：球赛|若丈夫选球赛；歌剧|若丈夫选歌剧）&br&&br&----------------PBE和PSE的关系----------------&br&&br&在完美信息情况下，所谓&节点&和&信息集&是同一个东西：在这个信息集上我掌握“这个节点到达了”的信息。但是不完美信息情况下一个信息集可以包含多个节点：在这个信息集上我知道&这些节点中的某一个到达了，但不确定是哪一个&。换句话说，在完美信息时，我&b&确定自己以概率1&/b&身处历史h，但不完美信息时，我&b&推测自己以概率p&/b&&b&身处历史h1，以概率1-p身处h2&/b&。&br&&br&由此看出两种博弈的区别在于：完美信息情况下定义的“子博弈”必须以单节点信息集开始，而不完美信息情况下存在多节点信息集。这导致的问题是不完美信息时多节点信息集的后续部分无法称为子博弈，在其中无法使用逆向归纳法。举个例子，比如我作为最后一个参与人面临选项a和b，当历史是h1的时候a比b好，当历史是h2的时候b比a好。可是如果我不知道h1和h2发生的概率，我根本无法做出选择。但是我又不能随便蒙一个p，因为要是我蒙p=0，保不准前面一个参与人实际上真的选了h1，那最后我会发现自己其实选错了。因此，在不完美信息博弈中，最重要的工作是&b&“合理地推测&我之前的人选了什么&/b&。&br&&br&为此，我们定义新的均衡概念。&br&&br&PBE的定义：一个策略组合+一个信念系统，其中策略组合的定义同SPE（在哪个信息集上选什么，不过现在信息集可以是多节点的），而信念系统定义为&b&轮到某人行动时&/b&，某人认为自己身处某条历史hi上的概率为pi，显然这个pi满足：&br&&br&1）若此人在单节点上，p(这个节点之前的历史)=1&br&2）若此人在多节点上，p(其它节点之前的历史)=0，sum(p(这些节点里的某一个))=1&br&&br&这样一来，在存在多节点信息集的时候也可以使用逆向归纳法了。&br&3）得到如上信念之后，每个参与人使用逆向归纳法求解自己的最优策略：选基于概率p和1-p期望收益最大的那个行动。&br&&br&但是p不是任意选取的，要求排除以下情况：假设在一个路径上第一个人先选A然后我选b。我选b是因为我猜上一个人以不低于0.4的概率选A；而上一个人用逆向归纳法算出来，发现只要我有可能我选b，他就一定不能选A——也就是说我选b是基于对上一个人的推测p(A)&0.4，而上一个人选A是基于他对我的推测p(b)=0。这样一个人认为这个路径h=(A,b)以正概率发生，另一个却认为h不可能发生。这种路径不应当是均衡路径！（既然不该觉得你以不低于0.4的概率选A，那我也就不该选b；而若你知道我绝不会选b，你可能反而不太可能选A……不是一个均衡）&br&&br&或者另一种情况：我选b是因为我猜测再往前一个人以不低于0.5的概率选L，另一个人选A是因为他猜测再往前那个人以不低于0.7的概率选R，这样就有我的p(L)&0.5，他的p(L)=1-p(R)&0.3，这种信念不一致的情况也应当被排除。（如果均衡最前面那个人真的选了R，那我的信念p(R)=1-p(L)&0.5就是错的。如果均衡其实是选L，那我对手的信念p(L)=1-p(R)&0.3就是错的——我们两个人之中一定有一个人的信念与均衡结果不符）&br&&br&这里矛盾的根源在于我的选择基于了“认为别人非理性”的信念：从我&觉得前面那人可能选A&的信念能够推导出&前面那人没有最大化自己的期望收益&的结论。这显然不是博弈论里希望看到的。我们希望每个博弈方都是理性的，都知道对手是理性的，都知道对手知道自己是理性的。。。因此，我们需要再加一个均衡要求以排除这种&轻敌&的信念：&br&&br&4）所有猜测p最终被均衡结果所验证：在均衡实现之前，所有参与人都应当认为最终成为均衡路径的h以包含1的正概率到达（得到类似pi(h)&x的结果，不允许pi(h)&x甚至pi(h)=0）。&br&&br&此时，所有单节点一路下来的SPE还继续是PBE，因为每个人的信念都是&这段历史以概率1发生&。但是博弈树其它部分就必须求解SPE：首先，排除严格劣势的行动及其后的部分；其次，对每个遗留的策略组合，计算参与人们做出这个选择所依赖的信念，检查是否存在条件4中所描述的冲突，所有不冲突的策略组合及其信念都可以是PBE。&br&&br&在排除了严格劣势行动（无法使用贝叶斯法则）之后，剩下的行动分为两类：“在均衡路径上的”（都可以应用贝叶斯法则）和“不在均衡路径上的”（无法应用贝叶斯法则），这里就是PBE定义中难以理解的两个一致性要求Orz。&br&&br&SPE和PBE的包含关系：&br&1）所有单节点一路下来的SPE等价于PBE。&br&2）多节点信息集往后（无法定义子博弈）的部分中的每个PBE都是SPE（每个PBE中令所有参与人的信念都是概率p(h)=1即得到SPE），但是包含&不在均衡路径上的行动&的策略组合可能仅是SPE而非PBE。比如这个博弈：参与人1选择a，b或c，如果选c游戏结束，如果选a或b则参与人2在不知道ab的情况下选x，y或z；参与人1最偏好c和(a,x)并对二者无差异（b是严格劣势的）；如果是a则参与人2的偏好为x&y&z，如果是b则参与人2的偏好为x&y&z，并且y&0.5x+0.5z（此时，对于参与人1，无法剔除严格劣势策略；并且唯一的子博弈是原博弈本身）。PSE有四个：参与人1选a，参与人2选x（因为参与人2知道参与人没有选c仅可能是他选了a，因此他的偏好是x&y&z，因此他选x）；参与人1选c结束游戏，参与人选x，y，z的任意一个（都是纳什均衡，并且是上述&唯一子博弈&的纳什均衡）；但是(参与人1选c，参与人2选y)不是一个PBE，因为y被一个混合策略0.5x+0.5z严格占优，不可能被任何参与人2的合理信念所支持。&br&&br&----------------SE和PBE的关系----------------&br&&br&解PBE时我们首先排除了无论哪段历史到达了都是严格劣势的策略，即假设参与人选择这些策略的概率一定是0。然后我们计算所有&b&遗留的信息集&/b&（单或多节点）上参与人的信念。因此，对于一个PBE：&br&&br&1）每个信息集上的信念（概率分布）是独立的；&br&2）严格劣势策略及之后的节点由于&b&注定&/b&无法达到，PBE对参与人在这些节点上的信念不作要求，即可以是任何信念。&br&&br&作为一个更强的均衡定义，SE要求在注定无法达到的节点上也对均衡信念和行动进行约束。换句话说，SE强调的是“虽然理性人不会选择严格劣势行动，但是后续参与人必须要考虑到万一他犯了错误自己应该如何应对”。一旦前面的参与人以正概率犯错，后续参与人就可以用这个概率值和贝叶斯法则（此时分母不为零）计算自己在这些节点上的最优反应和信念，计算方法和PBE的一样。&br&&br&同样，存在PBE均衡不是SE。考虑上述PBE模型：如果我们让参与人1偏好c胜过(a,x)，那a和b就都是严格劣势的，参与人2的节点注定无法达到，因此在PBE中参与人2可以持有任意信念或采取任意行动。但是假设参与人会以一个小概率p选a，以概率q选b，以概率1-p-q选c，那参与人2的SE行动就只剩下x（若p相对q较大）或z（若反之），作为SE的信念也会大大减少。&br&&br&============ 4月13日更 ===========&br&&br&----------------PE和SE的关系----------------&br&&br&在求SE的时候，为了让每个信息集上都能使用贝叶斯公式，我们需要构造一个信念的颤抖序列：序列中的每一项都是某个参与人对其所在的信息集上各个历史发生概率的全概率推测（全概率意味着每条历史以正概率发生）。如果我们让赋予非均衡路径的正概率越来越小直到0，则这个颤抖序列就以PBE或SPE均衡信念为极限。如果让SE中的第二个元素（策略）成为第一个元素（信念）的函数，这个函数是否在上述极限点连续呢？换句话说，参与人以一个微小的概率犯错导致信念的微小扰动，是否会导致所有参与人策略的跳跃性改变？（在每个人策略都是有限个的情况下，从行动a变成行动b姑且算是一个跳跃吧）或者说，什么样的SE可以对微小的信念扰动“稳健”？答案是若这个SE中没有人使用弱劣策略（回忆弱劣策略的定义，它只有在对手以概率0使用其他策略时才可能成为纳什均衡）。而这也是拓展博弈里PE的充要条件。&br&&br&这里充要条件都给出来了，反例就不举了哈。&br&&br&目前知道的就这么多了，谢谢大家。
这里说一下博弈论里出现的均衡概念吧。标准式博弈里的均衡请看另一个答案，这里写的都是拓展式博弈相关的。标准式博弈和拓展式博弈的区别：直观上一个描述静态博弈、一个描述动态博弈；不过我觉得本质上，前者的一个st…
对 &a data-hash=&c9cee996cdef11fc& href=&///people/c9cee996cdef11fc& class=&member_mention& data-editable=&true& data-title=&@慧航& data-hovercard=&p$b$c9cee996cdef11fc&&@慧航&/a& 的答案进行些补充：&br&&blockquote&Robert Lucas: But we’re not all using the same terminology. So Kreps and Wilson could talk
about sequential equilibrium. Game theory assumed rational expectations, but without
the terminology – I was citing [David] Kreps and [Robert] Wilson’s paper on
equilibrium, which was kind of a basic contribution to dynamic games. I don’t know if
those guys know about rational expectations. They certainly don’t mention it
anywhere in their paper&/blockquote&这里Robert Lucas（见P11，&a href=&///?target=http%3A///archive/refs0000227.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/archive/re&/span&&span class=&invisible&&fs0000227.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&）看到的analogy其实是sequential rationality（而非sequential equilibrium）和rational expectation之间的：&br&都是作为 expectation&img src=&///equation?tex=%5Cto& alt=&\to& eeimg=&1&& optimal responses（to the expectation） &img src=&///equation?tex=%5Cto& alt=&\to& eeimg=&1&&expectation（induced by the optimal response）和
belief&img src=&///equation?tex=%5Cto& alt=&\to& eeimg=&1&& best response （to the belief）&img src=&///equation?tex=%5Cto& alt=&\to& eeimg=&1&&belief（induced by the best response）的不动点。&br&&br&值得注意的是extensive game里的equilibrium path经常不能经过所有的information set，sequential rationality不考虑那些off-equilibrium path上的information set上的belief。&br&&br&而Kreps和Wilson做到的是对SPNE进一步精炼。由于subgame的定义的限制，下图只有一个subgame：&br&&img src=&/266ffa4e0e522a1bf282_b.jpg& data-rawwidth=&404& data-rawheight=&265& class=&content_image& width=&404&&&br&所以SPNE并不能消除上图中incredible theat的问题，而仅凭sequential rationality也不能排除NE：（a，L），因为均衡路径并不经过信息集2.&br&&br&Kreps&Wilson（1982）的想法是加入Selten定义perfect equilibrium的robustness的特征，存在一列均衡，当trembling hand的幅度趋于零，如果可以找到一列满足sequential rationality的NE收敛到这个NE，则它就是sequential equilibrium.&br&sequential equilibrium,作为一列completely mixed strategy NE的极限，必然也是SPNE，因为completely mixed strategy NE也是SPNE。&br&&br&BI是寻找finite extensive game的寻找SPNE算法，如果如果要找的是无穷期博弈的SPNE，当然BI就不灵了。&br&&br&&b&References:&/b&&br&Kreps, David M., and Robert Wilson. &Sequential equilibria.& &i&Econometrica: Journal of the Econometric Society&/i& (1982): 863-894.
的答案进行些补充： Robert Lucas: But we’re not all using the same terminology. So Kreps and Wilson could talk
about sequential equilibrium. Game theory assumed rational expectations, but without
the terminology – I was citing […
This is related to John Nash's personality and intelligence. The two are not really compatible with each other. Nash is anti-social, condescending to other people, and largely narcissistic. But his mathematics is detailed, imaginative, ingenious, and revolutionary. His work on embeddings directly give rise to the &i&H-principle&/i& in symplectic geometry, and his work on real algebraic geometry is still considered very deep for people working in his field. &br&&br&His colleague said:&br&&&br&He was immature, he was obnoxious, he was a &em&brat&/em&. What redeemed him was a keen, logical, &em&beautiful mind&/em&.&br&&&br&Reference:&br&&a class=& wrap external& href=&///?target=http%3A//www.u.arizona.edu/%7Emwalker/NashStory.htm& target=&_blank& rel=&nofollow noreferrer&&NY Times: John Nash&i class=&icon-external&&&/i&&/a&
This is related to John Nash's personality and intelligence. The two are not really compatible with each other. Nash is anti-social, condescending to other people, and largely narcissistic. But his mathematics is detailed, imaginative, in…
既然上面有很学术的解释了，那我就通俗的解释一下吧。无限阶次的理性共识是博弈论很多博弈理论的基础，可以类比“光滑”在物理中的基础作用。&br&一种“理想情况”，去试着解读“理性人假设”这个概念方便更好的理解和掌握。&br&&br&而在基于现实的博弈里，理性共识更多是有限层次的，来获取认知压制，举个例子，在空城计里，诸葛亮很聪明，司马懿知道诸葛亮很聪明，诸葛亮知道司马懿知道诸葛亮很聪明，可是，司马懿不知道诸葛亮知道司马懿知道诸葛亮很聪明，于是诸葛亮对于司马懿形成了认知压制，所以司马懿无法看破空城计。&br&——而至于无限次的情况，就要类推诸葛亮很聪明，司马懿知道诸葛亮很聪明，诸葛亮知道司马懿知道诸葛亮很聪明，司马懿也知道诸葛亮知道司马懿知道诸葛亮很聪明，然而诸葛亮同样知道司马懿知道诸葛亮知道司马懿知道诸葛亮很聪明，以此类推……&br&&br&在除了蜈蚣博弈等等纸面上的理论构建之外，它在现实中的作用约等于没有，博弈论之所以如此鸡肋就是大量的成果往往都建立在很多理想的假设基础上，比如理性人假设比如无限阶次的理性共识，给我们造成了极大的痛苦…&br&_(:з」∠)_好久没碰书或有漏洞，欢迎指正
既然上面有很学术的解释了，那我就通俗的解释一下吧。无限阶次的理性共识是博弈论很多博弈理论的基础，可以类比“光滑”在物理中的基础作用。一种“理想情况”，去试着解读“理性人假设”这个概念方便更好的理解和掌握。而在基于现实的博弈里，理性共识更…
&b&基于两个参与者两回合的不完全信息动态博弈&/b&&p&&b&1.
&/b&&b&基本思路&/b&&/p&&p&在不完全信息动态博弈（Dynamic
game of incomplete information）中，“自然”先选择参与人的类型&b&（“自然”就像上帝，是无所不能的决定参与者的属性；“类型”就像参与者的“特性”，比如对于某一种商品，一些企业的特点是以高成本生产，而另一些企业的特点是以低成本生产该产品）&/b&，参与者的类型只有参与人自己清楚，其他参与者不知道该参与者的类型；在“自然”选择后，参与人开始行动，参与人的行动有先有后（“类型”即参与者的某种属性，只有自己知道而其他人不知道，因此，这里关于类型的信息是“不完全信息”；“行动”是参与者选择的某种策略；“行动”有先后次序，说明博弈是动态的，而非一次性的）。&/p&&p&一方面，后行动者可以观察到前行动者的行为，但不能直接观测到前行动者的类型，但是，后行动者可以观察先行动者的行为来推断其类型或者修正对其类型的先验信念（先行动者类型的概率分布），然后选择自己的最优行动。&/p&&p&另一方面，先行动者预测到自己的行动将被后行动者所观察和推断，因此，先行动者会设法传递对自己有利的信息，而避免传递对自己不利的信息。&/p&&p&总而言之，不完全信息动态博弈不仅是参与人选择行动的过程，而且是参与人不断修正信念（对手的类型的概率分布）的过程。
&/p&&p&&b&2.
&/b&&b&举例（一个只有两个参与者，只有两回合的不完全信息动态博弈）&/b&&/p&&p&&b&假定：&/b&&/p&&p&1.
有两个时期，t1和t2。
t=1时，某行业的市场上只有一个垄断企业A，和一个潜在的（想要进入市场的）企业B。t=2时，如果B选择进入市场，则市场上有企业A和B；若B没有进入市场，则市场上仍只有A。&/p&&p&2.
B知道A有两种可能的类型，高成本和低成本，但是B并不知道A是什么类型，只有A知道自己是什么类型，而B本身只有一个类型，即成本等于2。最开始，B通过对A的基本了解（比如财务报表），判断A是高成本的概率是u，低成本的概率是（1-u）。在观测A的行为之后，若A选择了价格p，则B认为A是高成本的后验概率是是u*(p)，是低成本的后验概率是（1- u*(p)）&/p&&p&3.
t=1时，在B决定是否要进入之前，垄断者A要决定该时期的价格。假定t=1时，A只有三种可供选择的价格：p=4,5,6.
如果A是高成本，则对应的利润分别是2,6,7；如果A是低成本，则对应的利润分别是6,9,8. 因此，A的高成本单阶段最优垄断价格是p=6，A的低成本单阶段最优垄断价格是p=5.&/p&&p&4.
t=2时，如果B进入市场，假定若A是高成本，则B的净利润为+1；若A是低成本，则 B的净利润为-1. 如果B不进入，则A维持垄断，B的净利润为0。因此，&b&若&/b&&b&B&/b&&b&认为A&/b&&b&是高成本，则B&/b&&b&进入市场；若B&/b&&b&认为A&/b&&b&是低成本，则B&/b&&b&不进入市场&/b&，B的期望利润为E（B）=u*1+（1-u）*（-1）=2u-1。&/p&&p&&b&博弈树&/b&&/p&&br&&img data-rawheight=&392& data-rawwidth=&593& src=&/af744eabf2b_b.png& class=&origin_image zh-lightbox-thumb& width=&593& data-original=&/af744eabf2b_r.png&&&br&&p&&b&博弈的均衡（精炼的贝叶斯均衡）：&/b&&/p&&p&&b&均衡一：若u&0.5&/b&&b&，精炼的贝叶斯均衡是：无论高成本还是低成本，A&/b&&b&均将选择p=5&/b&&b&，B&/b&&b&均不进入市场。&/b&&/p&&p&&b&证明：&/b&&/p&&p&给定B的后验概率和战略：u*(6)=1,u*(4)=0,u*(5)=u&0.5。&/p&&p&如果高成本A选择p=6，B进入，则A两阶段的利润和是10 （7+3）；如果高成本A选择p=5，B不进入（因为2u*(5)-1=2u-1&0），则A两阶段的利润和是13（6+7）&10；如果高成本A选择p=4，B进入市场，则利润和为9。因此，高成本A选择p=5是最优的。&/p&&p&如果低成本A选择p=5时，B不进入市场，A的总利润为18（9+9）；低成本A选择p=6，B进入市场，A的总利润为13；低成本A选择p=4，B不进入市场，A的总利润为15，因此，低成本A选择p=5是最优的。&/p&&p&给定高成本A和低成本A的战略，即p=5。由于B不能观测到任何信息，使得u*(5)=u&0.5，进入的期望利润为（2u*(5)-1）&0，不进入的期望利润=0，因此B选择不进入市场是最优的。&/p&&p&&b&总结：&/b&无论A是高成本还是低成本，p=5均为最优价格。换言之，高成本A可以伪装成低成本A而提高总利润（虽然在这种情况下A在t=1的利润不是最大化，但是在t=2时A得到补偿，其在两阶段的利润和仍然达到最大化），而低成本A则无需暴露自己是低成本类型这个事实。&/p&&br&&p&&b&均衡二：若u&=0.5&/b&&b&，精炼的贝叶斯均衡是：低成本的A&/b&&b&选择p=4&/b&&b&，高成本的A&/b&&b&选择p=6&/b&&b&。若B&/b&&b&观测到p=4&/b&&b&，则B&/b&&b&不进入市场；若B&/b&&b&观测到p=5&/b&&b&或p=6&/b&&b&，则B&/b&&b&选择进入市场。&/b&&/p&&p&&b&证明：&/b&&/p&&p&给定B的后验概率和战略u*(6)=1,u*(4)=0,u*(5)=u&=0.5。&/p&&p&如果低成本A选择p=4，B不进入，他的总利润是15（6+9）；若A选择单阶段最优垄断价格p=5，B进入市场（此时由于u*(5)=u&=0.5，B的期望是2u*(5)-1&0，因此B会进入市场），则总利润为14；若A选择p=6，则B进入市场，A的总利润为13。所以，A选择p=4是最优的；&/p&&p&如果高成本A选择p=4，B不进入，总利润为9（2+7）；若A选择p=5，B进入市场，则总利润为9；若A选择p=6，B进入，总利润为10，因此p=6达到最优。&/p&&p&给定A的战略：低成本的A选择p=4，高成本的A选择p=6。B的最优策略是：如果观测到A选择p=5或6，则选择进入市场；如果观测到A选择
p=4，则不进入市场。&/p&&p&&b&总结：&/b&低成本的A选择p=4而不是p=5，是因为低成本A是唯一可以把价格定在p=4的企业，B不进入，因此低成本企业牺牲了t=1时的3单位（6-9）利润而赢得了t=2时的4单位（9-5）利润，低成本A牺牲的3单位利润可以看作是其为了证明自己是低成本者而支付的费用。&/p&
基于两个参与者两回合的不完全信息动态博弈1. 基本思路在不完全信息动态博弈（Dynamic
game of incomplete information）中，“自然”先选择参与人的类型（“自然”就像上帝，是无所不能的决定参与者的属性；“类型”就像参与者的“特性”，比如对于某一种…
谢邀…&br&&br&当然不会变，题主应该知道效用函数的正单调变换仍然表示原来的偏好吧…&br&&br&其实博弈论里面的payoff就是效用。这里的效用函数从strategy profile的集合映射到实数集R。&br&&br&PS：楼下&a href=&///people/5494e6eacf7bec016ba0a087e41f34cd& data-hash=&5494e6eacf7bec016ba0a087e41f34cd& class=&member_mention& data-hovercard=&p$b$5494e6eacf7bec016ba0a087e41f34cd&&@独鱼仅一&/a&那回答是错的。
谢邀… 当然不会变，题主应该知道效用函数的正单调变换仍然表示原来的偏好吧… 其实博弈论里面的payoff就是效用。这里的效用函数从strategy profile的集合映射到实数集R。 PS：楼下那回答是错的。
博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略（是不是听的有点复杂）&br&？？？？？？？^_^？？？？？？？？？&br&博弈论研究人们的策略互动行为。博弈论认为：一、人是理性的，即人人都会在约束条件下最大化自身的利益；二、人们在交往合作中有冲突，行为互相影响，而且信息不对称。博弈论研究人们的行为，在直接相互作用时的决策，以及决策的均衡问题。换句话说，博弈论研究如何使得人们在市场经济中，自愿做出大家都遵守和实施的有效制度安排，以增进社会的福利的机制。&br&：：：：：：：：：：：：：：：：：&br&列举一个经典案例吧！&br&—————————————————&br&　学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例——囚徒困境，非常耐人回味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙（即与警察合作，从而背叛他的同伙），或者保持沉默（也就是与他的同伙合作，而不是与警察合作）。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。&br&——那么，这两个囚犯该怎么办呢？&br&————～～～～～～～～～～～～～&br&你搞清楚其中的深刻含义了吗？&br&在这个例子里，博弈的参加者就是两个囚徒Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。&br&囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个”攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。&br&～～～～～～～～～～～～～…………&br&博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的，不是为了享受博弈分析的过程，而在于赢得更好的结局。博弈的思想既然来自现实生活，它就可以高度抽象化地用数学工具来表述，也可以用日常事例来说明，并运用到生活中去。没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学，但是这并不影响他通过运行策略来帮助田忌赢得赛马。&br&！！！！！！！！！！！！！！！！！&br&&br&博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。&br&简单地介绍下网上关于博弈论一些案例总结：&br&囚徒困境——个人理性与集体的非理性&br&智猪博弈——搭好顺风车，借力成事&br&枪手博弈——对比关系及策略决定强弱&br&斗鸡博弈——狭路相逢勇者未必胜&br&分蛋糕博弈——讨价还价的策略&br&以牙还牙——有一种智慧叫宽恕&br&鹰鸽博弈——路径依赖法则新解&br&蜈蚣博弈——从后往前的推理&br&猎鹿博弈——合作是硬道理&br&酒吧博弈——求同存异的智慧&br&鲇鱼效应——有竞争才有发展&br&重复博弈——冲突与合作方能共享&br&协和谬误——欲罢不能的错上加错&br&信息甄别——酒好不怕巷子深&br&人质困境——雪上加霜的囚徒困境　&br&脏脸博弈——都是共同知识惹的祸　&br&成本博弈——摆脱沉没成本羁绊的策略&br&手表定律——标准不同结论就不同&br&策略均衡——中庸之道&br&（不了解某个故事或博弈模型，网上可以搜到很详细地解释！）&br&$———————————————$&br&博弈论包罗万象，但记住四个字——在沃顿商学院讲授博弈论的教授路易斯·托马斯（Louis Thomas）说，“关键在于返璞归真。”&br&&br&（以上知识大多是网上内容总结，如有侵权，联系我删贴）&br&&img data-rawheight=&1024& data-rawwidth=&690& src=&/e832fd38a56cb4fe82a0393_b.jpg& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/e832fd38a56cb4fe82a0393_r.jpg&&&br&美丽心灵剧照&br&建议没看过的知友去看遍，很好地一部电影。可以让你大致了解纳什的一生及博弈论的创造过程。
博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。按照2005年因对博弈论的贡献而获得诺贝尔经济学…
谢邀。&br&个人理解，假设-&定义-&求解的过程。&br&当碰到动态的问题的时候，之前的纳什均衡不能用了，因为存在很多的均衡。但是其中有一些是明显有问题的，这个时候需要假设sequential rationality去剔除掉。更正式的，可以通过SPNE定义一个动态博弈的解。博弈论里面，对于许多复杂的应用，能提出一个解，而这个解满足一些好的性质，就是非常大大的贡献了。而这个SPNE直接定义了一个符合理性的均衡，并且非常容易求解。最后，为了求SPNE的均衡解，可以使用逆向归纳法。&br&个人理解。欢迎讨论。
谢邀。个人理解，假设-&定义-&求解的过程。当碰到动态的问题的时候，之前的纳什均衡不能用了，因为存在很多的均衡。但是其中有一些是明显有问题的，这个时候需要假设sequential rationality去剔除掉。更正式的，可以通过SPNE定义一个动态博弈的解。博弈…
已有帐号？
无法登录？
社交帐号登录

第一件纳什的老婆生了黑人没人觉得鸡肋吗

我要回帖

更多关于纳什孩子黑人的文章

随机推荐

第一件纳什的老婆生了黑人没人觉得鸡肋吗

我要回帖

更多关于 纳什孩子黑人 的文章

随机推荐

更多关于纳什孩子黑人的文章