第1行: |
第1行: |
− | 本词条由舒寒初步翻译。由Fernando审校。
| + | {{#seo: |
| + | |keywords=博弈论,策略,纳什均衡 |
| + | |description=是进行博弈的整一套算法,告诉玩家在整个游戏中的每个可能情况下应该做什么 |
| + | }} |
| | | |
− | 在博弈论中,一个玩家的'''策略'''是他或她在一个情境下的选项,这个情境下的产出不仅取决于他们自己的行动,而且也取决于其他人的行动<ref>[[Ben Polak]] ''Game Theory: Lecture 1 Transcript'' ECON 159, 5 September 2007, [[Open Yale Courses]].</ref>。玩家的策略将决定玩家在博弈的任何阶段将采取的行动。 | + | 在博弈论中,一个玩家的'''策略'''是他或她在一个情境下的选项,这个情境下的产出不仅取决于他们自己的行动,而且也取决于其他人的行动<ref>Ben Polak, ''Game Theory: Lecture 1 Transcript'' ECON 159, 5 September 2007, Open Yale Courses.</ref>。玩家的策略将决定玩家在博弈的任何阶段将采取的行动。 |
| | | |
− | '''策略'''的概念有时(错误地)与'''移动'''的概念相混淆。'''移动'''是一个玩家在博弈过程中的某个时刻所采取的行动(例如,在国际象棋中,将白色的象移动到 从a2移动到b3)。另一方面,'''策略'''是进行博弈的整一套算法,告诉玩家在整个游戏中的每个可能情况下应该做什么。
| + | 策略的概念有时(错误地)与移动的概念相混淆。'''移动'''是一个玩家在博弈过程中的某个时刻所采取的行动(例如,在国际象棋中,将白色的象移动到 从a2移动到b3)。另一方面,'''策略'''是进行博弈的整一套算法,告诉玩家在整个游戏中的每个可能情况下应该做什么。 |
| | | |
| '''策略配置'''(有时称为'''策略组合''')是一套明确定义好博弈时所有玩家的所有行动的策略。一个策略配置必须给且只给每个球员配置一项策略。 | | '''策略配置'''(有时称为'''策略组合''')是一套明确定义好博弈时所有玩家的所有行动的策略。一个策略配置必须给且只给每个球员配置一项策略。 |
| + | |
| + | |
| ==策略集== | | ==策略集== |
| | | |
第17行: |
第22行: |
| | | |
| 在贝叶斯博弈中,策略集类似于动态博弈中的策略集。它包括对任何可能的私人信息采取何种行动的规则。 | | 在贝叶斯博弈中,策略集类似于动态博弈中的策略集。它包括对任何可能的私人信息采取何种行动的规则。 |
| + | |
| + | |
| ===选择一个策略集=== | | ===选择一个策略集=== |
| | | |
第22行: |
第29行: |
| | | |
| 例如,严格地说,在最后通牒游戏中,玩家可以有以下策略: 拒绝($1,$3,$5,... ,$19) ,接受($0,$2,$4,... ,$20)。把所有这些战略都包括在内,会产生一个非常大的战略空间和一个有些困难的问题。博弈理论家可能相信他们可以将策略集限制为: { 对($0, $1, $2, ..., $20)中的x,拒绝所有 ≤ x的工作,接受任何一个 > x的工作。 | | 例如,严格地说,在最后通牒游戏中,玩家可以有以下策略: 拒绝($1,$3,$5,... ,$19) ,接受($0,$2,$4,... ,$20)。把所有这些战略都包括在内,会产生一个非常大的战略空间和一个有些困难的问题。博弈理论家可能相信他们可以将策略集限制为: { 对($0, $1, $2, ..., $20)中的x,拒绝所有 ≤ x的工作,接受任何一个 > x的工作。 |
| + | |
| + | |
| ==单纯和混合策略== | | ==单纯和混合策略== |
| | | |
第31行: |
第40行: |
| | | |
| '''完全混合策略'''是一个混合策略,其中玩家为每个纯策略设定一个严格正的概率。(完全混合策略对于平衡细化非常重要,比如颤抖手完美均衡。) | | '''完全混合策略'''是一个混合策略,其中玩家为每个纯策略设定一个严格正的概率。(完全混合策略对于平衡细化非常重要,比如颤抖手完美均衡。) |
| + | |
| + | |
| == 混合策略 == | | == 混合策略 == |
− |
| |
| === 举例 === | | === 举例 === |
| [[文件:收益矩阵示例.png|缩略图|收益矩阵]] | | [[文件:收益矩阵示例.png|缩略图|收益矩阵]] |
第40行: |
第50行: |
| | | |
| 考虑右图的收益矩阵(称为协调博弈)。此时,一个玩家选择行,另一个玩家选择列。选择行的玩家获得第一项收益,选择列的玩家获得第二项收益。如果行玩家以概率1选择A(也就是说一定选择A) ,那么我们就说他是在玩纯策略。如果列玩家抛出一枚硬币,要是硬币正面朝上,选择 A,要是硬币反面朝上,就选择B,那么我们就说他是在玩一种混合策略,而不是纯策略。 | | 考虑右图的收益矩阵(称为协调博弈)。此时,一个玩家选择行,另一个玩家选择列。选择行的玩家获得第一项收益,选择列的玩家获得第二项收益。如果行玩家以概率1选择A(也就是说一定选择A) ,那么我们就说他是在玩纯策略。如果列玩家抛出一枚硬币,要是硬币正面朝上,选择 A,要是硬币反面朝上,就选择B,那么我们就说他是在玩一种混合策略,而不是纯策略。 |
| + | |
| + | |
| === 重要性 === | | === 重要性 === |
| | | |
− | 约翰·福布斯·纳什在他的著名论文中证明了每个有限博弈都存在均衡。我们可以把纳什均衡分为两种类型。纯策略纳什均衡是所有参与者都采用纯策略的纳什均衡。混合策略纳什均衡是至少有一个参与人采用混合策略时的均衡。虽然纳什证明了每个有限博弈都有纳什均衡点,但并不是所有的博弈都有纯策略纳什均衡。有关没有纯策略纳什均衡点的博弈的例子,请参阅匹配便士。然而,许多博弈确实存在纯策略纳什均衡(例如: 协调博弈,囚徒困境,猎鹿赛局)。此外,博弈可以同时具有纯策略均衡和混合策略均衡。一个简单的例子是纯协调博弈,其中除了纯策略(A,A)和(B,B)之外,还存在一个混合均衡,也就是两个参与者对每个策略都设定概率为1 / 2。 | + | 约翰·福布斯·纳什在他的著名论文中证明了每个有限博弈都存在均衡。我们可以把纳什均衡分为两种类型。纯策略纳什均衡是所有参与者都采用纯策略的纳什均衡。混合策略纳什均衡是至少有一个参与人采用混合策略时的均衡。虽然纳什证明了每个有限博弈都有纳什均衡点,但并不是所有的博弈都有纯策略纳什均衡。有关没有纯策略纳什均衡点的博弈的例子,请参阅匹配便士。然而,许多博弈确实存在纯策略纳什均衡(例如: 协调博弈,囚徒困境,猎鹿赛局)。此外,博弈可以同时具有纯策略均衡和混合策略均衡。一个简单的例子是纯协调博弈,其中除了纯策略(A,A)和(B,B)之外,还存在一个混合均衡,也就是两个参与者对每个策略都设定概率为1/2。 |
| + | |
| + | |
| === 有争议的意义 === | | === 有争议的意义 === |
| | | |
第54行: |
第68行: |
| | | |
| 从那时起,博弈理论家对基于混合策略的结果的态度一直是矛盾的。混合策略仍然被广泛应用,因为它能在纯策略不存在均衡的博弈中提供纳什均衡,但是这个模型并没有说明为什么以及参与者如何随机化他们的决策。 | | 从那时起,博弈理论家对基于混合策略的结果的态度一直是矛盾的。混合策略仍然被广泛应用,因为它能在纯策略不存在均衡的博弈中提供纳什均衡,但是这个模型并没有说明为什么以及参与者如何随机化他们的决策。 |
| + | |
| + | |
| ===行为策略=== | | ===行为策略=== |
| | | |
第61行: |
第77行: |
| | | |
| 匹兹堡 和 鲁宾斯坦 (1997)用他们的 "心不在焉的司机" 博弈给出了一个著名的例子,说明为什么要求完全回忆的等价性。 | | 匹兹堡 和 鲁宾斯坦 (1997)用他们的 "心不在焉的司机" 博弈给出了一个著名的例子,说明为什么要求完全回忆的等价性。 |
| + | |
| + | |
| == 另请参见 == | | == 另请参见 == |
| | | |
− | * [[Nash equilibrium|纳什均衡]] | + | * [[纳什均衡]] |
| | | |
− | * [[Haven (graph theory)|Haven (图论)]] | + | * [[Haven (图论)]] |
| | | |
− | *[[Evolutionarily stable strategy|进化的稳定策略]] | + | *[[进化的稳定策略]] |
− | ==引用==
| |
| | | |
| + | |
| + | ==参考文献== |
| {{Reflist}} | | {{Reflist}} |
| | | |
| | | |
− | [[Category:Game theory]] | + | ==编者推荐== |
| + | [[File:shuxuemox.png|400px|thumb|upright=3| [https://campus.swarma.org/play/coursedetail?id=10503 行为博弈视角中的群体协调课程] 本课程重点关注了不同信息反馈方式下的群体协调行为,并对结果从心理学角度进行解读,以期为社会预期管理问题的解决提供一定的参考|right]] |
| + | |
| + | 下为一些链接(源于集智俱乐部公众号)能够更好的了解博弈论的相关信息: |
| + | 来自YouTube上面的Complexity Labs(Complexity Labs是一个专门介绍复杂系统领域知识的在线学习网站) |
| + | *[https://www.youtube.com/watch?v=hLQMWjnS8jE&app=desktop 关于博弈论的概述的视频资源 ] |
| + | *[https://goo.gl/jhLCSc 整个课程视频] |
| + | *[https://mp.weixin.qq.com/s/rRJzVqY-wO8e7DEgz-UUiQ 游戏博弈论:洞悉“剪刀-石头-布"背后的纳什均衡] |
| + | *[https://mp.weixin.qq.com/s/3tOfRIzndnbdP4XlKIfhfw 对于《多人博弈纳什均衡的全新解法》论文解读] |
| + | |
| + | 来自集智学园关于博弈论的相关课程 |
| + | |
| + | *[https://campus.swarma.org/play/coursedetail?id=10954 周亚:演化博弈与机制设计] |
| + | 此外,还有根据纳什的传记改编的电源 |
| + | *[https://www.iqiyi.com/v_19rrnppl5w.html?fv=p_08_01&vfm=m_332_bing 《美丽心灵》本片是关于20世纪伟大数学家小约翰•福布斯-纳什的人物传记片。] |
| + | |
| + | *[https://book.douban.com/subject/3391220/ 《黑天鹅效应:你身边无处不在的风险与恐惧》作者丹·加德纳] |
| + | ::本书在对风险领域研究的开创性意义方面值得关注。丹·加德纳作为一位资深的媒体记者,能够静下心来系统探讨关乎人们身心健康的风险与恐惧问题,着实不易,而丹·加德纳却令人信服地做到了。 |
| + | </br> |
| + | |
| | | |
− | {{Game theory}}
| + | ---- |
| + | 本中文词条由舒寒翻译,Fernando审校,[[用户:薄荷|薄荷]]编辑,如有问题,欢迎在讨论页面留言。 |
| | | |
− | 范畴: 博弈论
| |
| | | |
− | <noinclude>
| |
| | | |
− | <small>This page was moved from [[wikipedia:en:Strategy (game theory)]]. Its edit history can be viewed at [[策略/edithistory]]</small></noinclude>
| + | '''本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。''' |
| | | |
− | [[Category:待整理页面]] | + | [[Category:博弈论]] |