更改

进化稳定策略 (查看源代码)

2021年1月9日 (六) 21:21的版本

删除1字节、 2021年1月9日 (六) 21:21

无编辑摘要

第1行：第1行：

{{#seo:

−

|keywords=~~进化均衡策略，随机稳定平衡，鹰鸽博弈，生物建模和进化博弈论~~

+

|keywords=进化稳定策略，随机稳定平衡，鹰鸽博弈，生物建模和进化博弈论

|description=是指一个种群在特定环境下采用的策略或策略组，。

}}

−

**建议将后文全文中的game的翻译改为“博弈”,玩家可改为参与者/生物/种群（中的）个体/进化的参与者——似乎是具有比喻义的词语

+

*建议将后文全文中的game的翻译改为“博弈”,玩家可改为参与者/生物/种群（中的）个体/进化的参与者——似乎是具有比喻义的词语

−

'''~~进化均衡策略~~ Evolutionarily Stable Strategy（ESS）'''是指一个种群在特定环境下采用的策略或策略组，它具有不可渗透性，即该群体的进化策略不可能受到初期占比小的其他策略或策略组的影响。这与''' 博弈论 Game Theory'''，''' 行为生态学 Behavioural Ecology'''和'''进化心理学 Evolutionary Psychology'''~~有关。进化均衡策略是~~''' ~~纳什均衡~~ Nash equilibrium'''~~的细化，相当于是稳定进化的纳什均衡：一旦该种群固定了所采用的策略，仅依靠自然选择过程就足以防止其他策略（如变异）的成功入侵。~~'''该理论并非通过有目的性地处理外部环境可能发生的变化，来引入新的种群进化选择力。 The theory is not intended to deal with the possibility of gross external changes to the environment that bring new selective forces to bear.'''这一理论想要阐述的不是处理外部环境发生重大变化的可能性，而是这种变化会带来新的选择性力量。

+

'''进化稳定策略 Evolutionarily Stable Strategy（ESS）'''是指一个种群在特定环境下采用的策略或策略组，它具有不可渗透性，即该群体的进化策略不可能受到初期占比小的其他策略或策略组的影响。这与''' 博弈论 Game Theory'''，''' 行为生态学 Behavioural Ecology'''和'''进化心理学 Evolutionary Psychology'''有关。进化稳定策略是''' 纳什稳定 Nash equilibrium'''的细化，相当于是稳定进化的纳什稳定：一旦该种群固定了所采用的策略，仅依靠自然选择过程就足以防止其他策略（如变异）的成功入侵。'''该理论并非通过有目的性地处理外部环境可能发生的变化，来引入新的种群进化选择力。 The theory is not intended to deal with the possibility of gross external changes to the environment that bring new selective forces to bear.'''这一理论想要阐述的不是处理外部环境发生重大变化的可能性，而是这种变化会带来新的选择性力量。

−

在1972年'''约翰·梅纳德·史密斯 John Maynard Smith'''出版的书中，<ref name="OEJMS">{{cite book |author=Maynard Smith, J. |authorlink=John Maynard Smith |chapter=Game Theory and The Evolution of Fighting |title=On Evolution |publisher=Edinburgh University Press |year=1972 |isbn=0-85224-223-9 |url-access=registration |url=https://archive.org/details/onevolution0000mayn }}</ref> 进化均衡策略首次作为一个特定的术语出现并被广泛应用于行为生态学和经济学之中。如今在人类学、进化心理学、哲学和政治学中，这一概念也已得到使用。

+

在1972年'''约翰·梅纳德·史密斯 John Maynard Smith'''出版的书中，<ref name="OEJMS">{{cite book |author=Maynard Smith, J. |authorlink=John Maynard Smith |chapter=Game Theory and The Evolution of Fighting |title=On Evolution |publisher=Edinburgh University Press |year=1972 |isbn=0-85224-223-9 |url-access=registration |url=https://archive.org/details/onevolution0000mayn }}</ref> 进化稳定策略首次作为一个特定的术语出现并被广泛应用于行为生态学和经济学之中。如今在人类学、进化心理学、哲学和政治学中，这一概念也已得到使用。

==发展历史==

−

'''~~进化均衡策略~~'''是由'''约翰·梅纳德·史密斯 John·Maynard·Smith'''和'''乔治·R·普赖斯 George·R·Price''' 在1973年的《Nature》杂志上提出并定义的。<ref name="JMSandP73">{{cite journal |doi=10.1038/246015a0 |author1=Maynard Smith, J. |authorlink1=John Maynard Smith |author2=Price, G.R. |authorlink2=George R. Price |title=The logic of animal conflict |journal=Nature |volume=246 |issue=5427 |pages=15–8 |year=1973 |bibcode=1973Natur.246...15S}}</ref>但是由于同行评审《Nature》中的论文花费了大量时间，导致在此之前，Maynard·Smith就在1972年的一本论文集《On Evolution》<ref name="OEJMS"/> 中发表了另一篇论文，因此有时学者们会选择引用他在1972年出版的《论进化论》.上发表的论文而非1973年《Nature》杂志上的，尽管通常《Nature》杂志上的论文很短，但是大学图书馆可能收藏有《Nature》的副本；随后1974年，Maynard·Smith在《理论生物学》杂志上又发表了一篇更长的论文。<ref>{{cite journal |doi=10.1016/0022-5193(74)90110-6 |author=Maynard Smith, J. |title=The Theory of Games and the Evolution of Animal Conflicts |journal=Journal of Theoretical Biology |volume=47 |issue=1 |pages=209–21 |year=1974 |pmid=4459582 |url=http://www.dklevine.com/archive/refs4448.pdf }}</ref> Maynard·Smith在1982年的新著作《演化与博弈论 Evolution and the Theory of Games》中，他又进一步解释了这个概念。<ref name="JMS82">{{cite book |author=Maynard Smith, John |title=Evolution and the Theory of Games |year=1982 |isbn=0-521-28884-3 |title-link=Evolution and the Theory of Games }}</ref>之后该版本的解释时常被引用。实际上，虽然往往没有引证给出，但是因为引用者已经假定了读者是熟悉它的，因此进化均衡策略已经成为了博弈论的核心。

+

'''进化稳定策略'''是由'''约翰·梅纳德·史密斯 John·Maynard·Smith'''和'''乔治·R·普赖斯 George·R·Price''' 在1973年的《Nature》杂志上提出并定义的。<ref name="JMSandP73">{{cite journal |doi=10.1038/246015a0 |author1=Maynard Smith, J. |authorlink1=John Maynard Smith |author2=Price, G.R. |authorlink2=George R. Price |title=The logic of animal conflict |journal=Nature |volume=246 |issue=5427 |pages=15–8 |year=1973 |bibcode=1973Natur.246...15S}}</ref>但是由于同行评审《Nature》中的论文花费了大量时间，导致在此之前，Maynard·Smith就在1972年的一本论文集《On Evolution》<ref name="OEJMS"/> 中发表了另一篇论文，因此有时学者们会选择引用他在1972年出版的《论进化论》.上发表的论文而非1973年《Nature》杂志上的，尽管通常《Nature》杂志上的论文很短，但是大学图书馆可能收藏有《Nature》的副本；随后1974年，Maynard·Smith在《理论生物学》杂志上又发表了一篇更长的论文。<ref>{{cite journal |doi=10.1016/0022-5193(74)90110-6 |author=Maynard Smith, J. |title=The Theory of Games and the Evolution of Animal Conflicts |journal=Journal of Theoretical Biology |volume=47 |issue=1 |pages=209–21 |year=1974 |pmid=4459582 |url=http://www.dklevine.com/archive/refs4448.pdf }}</ref> Maynard·Smith在1982年的新著作《演化与博弈论 Evolution and the Theory of Games》中，他又进一步解释了这个概念。<ref name="JMS82">{{cite book |author=Maynard Smith, John |title=Evolution and the Theory of Games |year=1982 |isbn=0-521-28884-3 |title-link=Evolution and the Theory of Games }}</ref>之后该版本的解释时常被引用。实际上，虽然往往没有引证给出，但是因为引用者已经假定了读者是熟悉它的，因此进化稳定策略已经成为了博弈论的核心。

第18行：第18行： −

~~事实上“进化均衡”这个概念源自于麦克阿瑟~~ R·H·MacArthur<ref>{{cite book |author=MacArthur, R. H. |editor=Waterman T. |editor2=Horowitz H. |title=Theoretical and mathematical biology |publisher=Blaisdell |location=New York |year=1965 }}</ref>和汉密尔顿 W·D·Hamilton<ref>{{cite journal |doi=10.1126/science.156.3774.477 |author=Hamilton, W.D. |title=Extraordinary sex ratios |journal=Science |volume=156 |issue=3774 |pages=477–88 |year=1967 |pmid=6021675 |jstor=1721222|bibcode = 1967Sci...156..477H }}</ref>关于性别比例的研究，以及'''费雪原理 Fisher's principle'''，尤其是汉密尔顿（1967）提出的“''' 无敌战略Unbeatable Strategy'''”。随后1999年，Maynard·Smith因其对“进化均衡策略”概念的发展以及“行为进化博弈论“的应用研究做出了杰出贡献，与以上学者共同获得了著名的Crafoord奖。.<ref>[http://www.crafoordprize.se/press/arkivpressreleases/thecrafoordprize1999.5.32d4db7210df50fec2d800018201.html Press release] for the 1999 Crafoord Prize</ref>

+

事实上“进化稳定”这个概念源自于麦克阿瑟 R·H·MacArthur<ref>{{cite book |author=MacArthur, R. H. |editor=Waterman T. |editor2=Horowitz H. |title=Theoretical and mathematical biology |publisher=Blaisdell |location=New York |year=1965 }}</ref>和汉密尔顿 W·D·Hamilton<ref>{{cite journal |doi=10.1126/science.156.3774.477 |author=Hamilton, W.D. |title=Extraordinary sex ratios |journal=Science |volume=156 |issue=3774 |pages=477–88 |year=1967 |pmid=6021675 |jstor=1721222|bibcode = 1967Sci...156..477H }}</ref>关于性别比例的研究，以及'''费雪原理 Fisher's principle'''，尤其是汉密尔顿（1967）提出的“''' 无敌战略Unbeatable Strategy'''”。随后1999年，Maynard·Smith因其对“进化稳定策略”概念的发展以及“行为进化博弈论“的应用研究做出了杰出贡献，与以上学者共同获得了著名的Crafoord奖。.<ref>[http://www.crafoordprize.se/press/arkivpressreleases/thecrafoordprize1999.5.32d4db7210df50fec2d800018201.html Press release] for the 1999 Crafoord Prize</ref>

−

~~进化均衡策略的应用：~~

+

进化稳定策略的应用：

−

* ~~进化均衡策略是理查德·道金斯~~ Richard Dawkins1976年最畅销的著作《自私的基因 The Selfish Gene》中用来分析进化的主要元素。

+

* 进化稳定策略是理查德·道金斯 Richard Dawkins1976年最畅销的著作《自私的基因 The Selfish Gene》中用来分析进化的主要元素。

−

* 由罗伯特·阿克塞尔罗德 Robert Axelrod在1984年创作出版的《合作的进化 The Evolution of ~~Cooperation》一书中首次将进化均衡策略用于社会科学领域。从那时起，它就被广泛用于社会科学，包括人类学、经济学、哲学和政治学。~~

+

* 由罗伯特·阿克塞尔罗德 Robert Axelrod在1984年创作出版的《合作的进化 The Evolution of Cooperation》一书中首次将进化稳定策略用于社会科学领域。从那时起，它就被广泛用于社会科学，包括人类学、经济学、哲学和政治学。

−

* ~~在社会科学中，人们最主要的兴趣不是将进化均衡策略作为生物进化的终点，而是将其作为文化进化或个体学习的终点。~~<ref name="AlexanderSEP">{{cite encyclopedia |url=http://plato.stanford.edu/entries/game-evolutionary/ |title=Evolutionary Game Theory |accessdate=31 August 2007 |last1=Alexander|first1=Jason McKenzie |date=23 May 2003 |encyclopedia=Stanford Encyclopedia of Philosophy}}</ref>

+

* 在社会科学中，人们最主要的兴趣不是将进化稳定策略作为生物进化的终点，而是将其作为文化进化或个体学习的终点。<ref name="AlexanderSEP">{{cite encyclopedia |url=http://plato.stanford.edu/entries/game-evolutionary/ |title=Evolutionary Game Theory |accessdate=31 August 2007 |last1=Alexander|first1=Jason McKenzie |date=23 May 2003 |encyclopedia=Stanford Encyclopedia of Philosophy}}</ref>

−

* ~~在进化心理学中，进化均衡策略主要被用作人类生物学进化的模型。~~

+

* 在进化心理学中，进化稳定策略主要被用作人类生物学进化的模型。

== 策略的假设与动机==

−

在博弈论中，[[~~纳什均衡~~ Nash equilibrium]]相当于一种传统的解决方案概念，而这依赖于玩家的对它的认知。它假定玩家知道游戏的结构并且会有意识地尝试预测对手的行动以期最大程度地提高自己的收益。另外，纳什均衡也假定所有玩家都知道以下规则（请参阅''' 常识性知识 Common Knowledge'''~~）。后来这些假设又被用于解释为什么游戏参与者们会选择纳什均衡策略。~~

+

在博弈论中，[[纳什稳定 Nash equilibrium]]相当于一种传统的解决方案概念，而这依赖于玩家的对它的认知。它假定玩家知道游戏的结构并且会有意识地尝试预测对手的行动以期最大程度地提高自己的收益。另外，纳什稳定也假定所有玩家都知道以下规则（请参阅''' 常识性知识 Common Knowledge'''）。后来这些假设又被用于解释为什么游戏参与者们会选择纳什稳定策略。

−

进化均衡策略的动机则完全不同。在这一语境下玩家的策略被假定为具有生物编码性而且可遗传至下一代。玩家个人并不能控制自己的策略，也无需了解游戏规则。他们繁殖并服从自然选择，而游戏的收益则代表着繁衍成功（生物适应性）。同时可以想象，在繁衍生息过程中，游戏策略偶尔会通过类似基因突变而无计划地发生变异，产生其方案策略。之后他们会通过互相抵制直到出现最优势的策略，即进化均衡策略。

+

进化稳定策略的动机则完全不同。在这一语境下玩家的策略被假定为具有生物编码性而且可遗传至下一代。玩家个人并不能控制自己的策略，也无需了解游戏规则。他们繁殖并服从自然选择，而游戏的收益则代表着繁衍成功（生物适应性）。同时可以想象，在繁衍生息过程中，游戏策略偶尔会通过类似基因突变而无计划地发生变异，产生其方案策略。之后他们会通过互相抵制直到出现最优势的策略，即进化稳定策略。

−

考虑到本质上全然不同的动机假设，进化均衡策略和纳什均衡偶然的一致性令人感到惊讶。实际上，每个进化均衡策略都有对应的纳什均衡，但是某些纳什均衡却不同于进化均衡策略。

+

考虑到本质上全然不同的动机假设，进化稳定策略和纳什稳定偶然的一致性令人感到惊讶。实际上，每个进化稳定策略都有对应的纳什稳定，但是某些纳什稳定却不同于进化稳定策略。

−

==~~纳什均衡~~ Nash equilibrium ==

+

==纳什稳定 Nash equilibrium ==

<!--

{{Payoff matrix | Name = 伤害你的邻居 Harm thy neighbor

第50行：第50行：

-->

−

进化均衡策略是纳什均衡的改进式（关于两者的对比见下一节）。在纳什均衡中，如果所有参与者都采用各自的策略方案，且都无法通过改用任何其他策略以获益，那么在这两人的游戏中，我们将此看作一个策略对。令E(''S'',''T'')表示策略''S''对策略''T''的收益。当且仅当双方都成立且所有''T''≠''S''时，策略对(''S'', ''S'') ~~为该两人游戏中的纳什均衡：~~

+

进化稳定策略是纳什稳定的改进式（关于两者的对比见下一节）。在纳什稳定中，如果所有参与者都采用各自的策略方案，且都无法通过改用任何其他策略以获益，那么在这两人的游戏中，我们将此看作一个策略对。令E(''S'',''T'')表示策略''S''对策略''T''的收益。当且仅当双方都成立且所有''T''≠''S''时，策略对(''S'', ''S'') 为该两人游戏中的纳什稳定：

第59行：第59行： −

即使采用 ''T'' ~~后其得分相等，纳什均衡也被认为是稳定的，当然前提是假设不存在长期动机去鼓励玩家采用~~ ''T'' 而不是 ''S''。

+

即使采用 ''T'' 后其得分相等，纳什稳定也被认为是稳定的，当然前提是假设不存在长期动机去鼓励玩家采用 ''T'' 而不是 ''S''。

−

Smith和Price为策略 ''S'' ~~指定了两个条件，使其成为进化均衡策略，对于所有的~~ ''T''≠''S''，两个选其一：

+

Smith和Price为策略 ''S'' 指定了两个条件，使其成为进化稳定策略，对于所有的 ''T''≠''S''，两个选其一：

:1. E(S,S) > E(T,S)

第69行：第69行： −

第一个条件有时称为'''~~严格纳什均衡~~'''。<ref>{{cite journal |doi=10.1007/BF01737572 |author=Harsanyi, J |authorlink=John Harsanyi |title=Oddness of the number of equilibrium points: a new proof |journal=Int. J. Game Theory |volume=2 |issue=1 |pages=235–50 |year=1973 }}</ref> 而第二个有时称为'''梅纳德·史密斯第二条件'''，它意味着，尽管策略 ''T'' 在对抗策略 ''S'' 时收益不变，但继续使用策略 ''S'' 的玩家在对抗策略T时收益具有明显优势。

+

第一个条件有时称为'''严格纳什稳定'''。<ref>{{cite journal |doi=10.1007/BF01737572 |author=Harsanyi, J |authorlink=John Harsanyi |title=Oddness of the number of equilibrium points: a new proof |journal=Int. J. Game Theory |volume=2 |issue=1 |pages=235–50 |year=1973 }}</ref> 而第二个有时称为'''梅纳德·史密斯第二条件'''，它意味着，尽管策略 ''T'' 在对抗策略 ''S'' 时收益不变，但继续使用策略 ''S'' 的玩家在对抗策略T时收益具有明显优势。

−

后来伯恩哈德·托马斯 Bernhard Thomas在他的论文《On evolutionarily stable sets》中提出了更大胆的定义。<ref name="Thomas85">{{cite journal |author=Thomas, B. |title=On evolutionarily stable sets |journal=J. Math. Biology |volume=22 |pages=105–115 |year=1985 |doi=10.1007/bf00276549}}</ref> ~~它不同于纳什均衡概念在进化均衡策略中的作用。根据上面第一个定义中给出的术语，此处要求对所有~~ ''T''≠''S''：

+

后来伯恩哈德·托马斯 Bernhard Thomas在他的论文《On evolutionarily stable sets》中提出了更大胆的定义。<ref name="Thomas85">{{cite journal |author=Thomas, B. |title=On evolutionarily stable sets |journal=J. Math. Biology |volume=22 |pages=105–115 |year=1985 |doi=10.1007/bf00276549}}</ref> 它不同于纳什稳定概念在进化稳定策略中的作用。根据上面第一个定义中给出的术语，此处要求对所有 ''T''≠''S''：

:1. E(S,S) ≥ E(T,S)，并且

第79行：第79行： −

在这两个公式中，第一个指定了该策略采取纳什均衡，而第二则是指定满足梅纳德·史密斯第二条件。请注意，这两个定义并不完全相等：例如，在接下来的协调游戏中的每个独立策略都是第一个定义的进化均衡策略，而非第二个。

+

在这两个公式中，第一个指定了该策略采取纳什稳定，而第二则是指定满足梅纳德·史密斯第二条件。请注意，这两个定义并不完全相等：例如，在接下来的协调游戏中的每个独立策略都是第一个定义的进化稳定策略，而非第二个。

第85行：第85行： −

~~这种表述更清楚地强调了纳什均衡条件在进化均衡策略中的作用。同时还考虑到对相关概念进行自然定义，例如~~''' ~~弱进化均衡策略~~ Weak evolutionarily stable strategy'''或''' ~~进化均衡集合~~ Evolutionarily stable set'''。<ref name="Thomas85"/>

+

这种表述更清楚地强调了纳什稳定条件在进化稳定策略中的作用。同时还考虑到对相关概念进行自然定义，例如''' 弱进化稳定策略 Weak evolutionarily stable strategy'''或''' 进化稳定集合 Evolutionarily stable set'''。<ref name="Thomas85"/>

−

===~~纳什均衡与进化均衡策略之间差异的示例~~===

+

===纳什稳定与进化稳定策略之间差异的示例===

{| class="wikitable"

第112行：第112行：

|}

−

~~在大多数简单的游戏中，进化均衡策略和纳什均衡完全重合。例如，在游戏~~''' 《囚徒困境 Prisoner's Dilemma》'''~~中，只有一个纳什均衡，其策略（叛变 Defect）也是一种进化均衡策略。~~

+

在大多数简单的游戏中，进化稳定策略和纳什稳定完全重合。例如，在游戏''' 《囚徒困境 Prisoner's Dilemma》'''中，只有一个纳什稳定，其策略（叛变 Defect）也是一种进化稳定策略。

−

~~还有一些游戏可能具有非进化均衡策略的纳什均衡。例如，在游戏~~''' 《以邻为壑 Harm thy neighbor》'''中（此处显示为回报矩阵），(''A'', ''A'')和(''B'', ''B'')都是纳什均衡，因为玩家无法通过选择放弃任一个来做得更好。但是，只有B是进化均衡策略（也是强纳什）。A不是进化均衡策略，因此B可以中立地入侵A策略的群体并占据优势地位，因为B对B的得分要比A对B的得分高。由于E(''A'', ''A'') = E(''B'', ''A'')，因此可以通过梅纳德·史密斯的第二个条件来捕获此动态，但是 E(''A'',''B'') > E(''B'',''B'')并非如此。

+

还有一些游戏可能具有非进化稳定策略的纳什稳定。例如，在游戏''' 《以邻为壑 Harm thy neighbor》'''中（此处显示为回报矩阵），(''A'', ''A'')和(''B'', ''B'')都是纳什稳定，因为玩家无法通过选择放弃任一个来做得更好。但是，只有B是进化稳定策略（也是强纳什）。A不是进化稳定策略，因此B可以中立地入侵A策略的群体并占据优势地位，因为B对B的得分要比A对B的得分高。由于E(''A'', ''A'') = E(''B'', ''A'')，因此可以通过梅纳德·史密斯的第二个条件来捕获此动态，但是 E(''A'',''B'') > E(''B'',''B'')并非如此。

第141行：第141行： −

~~纳什均衡以及同等评分的策略都可以是进化均衡策略。例如，在游戏~~''' 《伤害大家 Harm everyone》'''中， ''C'' ~~是进化均衡策略，因为它满足了梅纳德·史密斯第二条件。~~ ''D'' 策略可以暂时入侵C策略群体，因为D策略可以获得和 ''C'' 策略一样的评分。但是当他们开始互相对抗时，他们会付出一定的代价；''C'' 对 ''D'' 的得分比D对D的得分高。因此，尽管 E(''C'', ''C'') = E(''D'', ''C'')，但 E(''C'',''D'') > E(''D'',''D'')~~。因此，最后C是最终进化均衡策略。~~

+

纳什稳定以及同等评分的策略都可以是进化稳定策略。例如，在游戏''' 《伤害大家 Harm everyone》'''中， ''C'' 是进化稳定策略，因为它满足了梅纳德·史密斯第二条件。 ''D'' 策略可以暂时入侵C策略群体，因为D策略可以获得和 ''C'' 策略一样的评分。但是当他们开始互相对抗时，他们会付出一定的代价；''C'' 对 ''D'' 的得分比D对D的得分高。因此，尽管 E(''C'', ''C'') = E(''D'', ''C'')，但 E(''C'',''D'') > E(''D'',''D'')。因此，最后C是最终进化稳定策略。

−

~~还有一些游戏即使具有纯粹的纳什均衡策略，但可能它们都不是进化均衡策略。比如游戏~~''' 《小鸡博弈 The Game of Chicken》''',~~该游戏中有两种纯粹的纳什均衡策略（转身离开Swerve，留下Stay）和（留下Stay，转身离开Swerve）。但是，在~~~~缺失的情况下，Swerve和Stay都不是进化均衡策略。此时存在第三种纳什均衡，它属于混合策略并且是该游戏的进化均衡策略（详情请参见~~''' 《[[鹰鸽博弈 Hawk-dove]]》'''游戏和''' 《[[最佳响应 Best Response]]》'''）。

+

还有一些游戏即使具有纯粹的纳什稳定策略，但可能它们都不是进化稳定策略。比如游戏''' 《小鸡博弈 The Game of Chicken》''',该游戏中有两种纯粹的纳什稳定策略（转身离开Swerve，留下Stay）和（留下Stay，转身离开Swerve）。但是，在缺失的情况下，Swerve和Stay都不是进化稳定策略。此时存在第三种纳什稳定，它属于混合策略并且是该游戏的进化稳定策略（详情请参见''' 《[[鹰鸽博弈 Hawk-dove]]》'''游戏和''' 《[[最佳响应 Best Response]]》'''）。

−

最后一个示例指出了纳什均衡与进化均衡策略之间的重要区别。纳什均衡是在策略集（每个参与者的策略规范）上定义的，而进化均衡策略是根据策略本身定义的。进化均衡策略定义的平衡必须始终是对称的，因此其平衡点更少。

+

最后一个示例指出了纳什稳定与进化稳定策略之间的重要区别。纳什稳定是在策略集（每个参与者的策略规范）上定义的，而进化稳定策略是根据策略本身定义的。进化稳定策略定义的平衡必须始终是对称的，因此其平衡点更少。

==与进化稳定状态的比较==

−

~~在种群生物学中，进化均衡策略和~~''' 进化稳定状态Evolutionarily Stable State'''这两个概念密切相关，但却描述了不同的情况。

+

在种群生物学中，进化稳定策略和''' 进化稳定状态Evolutionarily Stable State'''这两个概念密切相关，但却描述了不同的情况。

−

在进化均衡策略中，如果所有种群的成员都采用它，那么任何突变策略都无法入侵。无形中只要所有成员都使用了这种策略，就不再有“理性”的选择。进化均衡策略是经典博弈论的一部分。

+

在进化稳定策略中，如果所有种群的成员都采用它，那么任何突变策略都无法入侵。无形中只要所有成员都使用了这种策略，就不再有“理性”的选择。进化稳定策略是经典博弈论的一部分。

第159行：第159行： −

B. Thomas将“进化均衡策略”这一术语应用于可混合的独立策略，并将“进化稳定种群状态”应用于采取纯策略的混合种群，该应用在形式上可能等同于混合的“进化均衡策略”。<ref>{{cite journal |doi=10.1016/0040-5809(84)90023-6 |author=Thomas, B. |title=Evolutionary stability: states and strategies |journal=Theor. Popul. Biol. |volume=26 |issue=1 |pages=49–67 |year=1984 }}</ref>

+

B. Thomas将“进化稳定策略”这一术语应用于可混合的独立策略，并将“进化稳定种群状态”应用于采取纯策略的混合种群，该应用在形式上可能等同于混合的“进化稳定策略”。<ref>{{cite journal |doi=10.1016/0040-5809(84)90023-6 |author=Thomas, B. |title=Evolutionary stability: states and strategies |journal=Theor. Popul. Biol. |volume=26 |issue=1 |pages=49–67 |year=1984 }}</ref>

第165行：第165行： −

==~~随机进化均衡策略~~ ==

+

==随机进化稳定策略 ==

−

在进化均衡策略的经典定义中，没有任何突变策略可以入侵。然而在有限种群中，尽管可能性很小，但是任意一种突变体原则上是可能入侵的，这就意味着在这个种群中绝对没有进化均衡策略的存在。如果在无限种群中，存在一个概率为P的新突变策略入侵，此时，正如对冲交易的进化过程所描述的那样，进化均衡策略就被认为是具有概率大于p的策略方案且开始反击最初入侵的新突变策略个体。<ref>{{cite journal |last=King |first=Oliver D. |author2=Masel, Joanna |author2link=Joanna Masel |title=The evolution of bet-hedging adaptations to rare scenarios |journal=Theoretical Population Biology|date=1 December 2007 |volume=72 |issue=4 |pages=560–575 |doi=10.1016/j.tpb.2007.08.006 |pmid=17915273 |pmc=2118055}}</ref>

+

在进化稳定策略的经典定义中，没有任何突变策略可以入侵。然而在有限种群中，尽管可能性很小，但是任意一种突变体原则上是可能入侵的，这就意味着在这个种群中绝对没有进化稳定策略的存在。如果在无限种群中，存在一个概率为P的新突变策略入侵，此时，正如对冲交易的进化过程所描述的那样，进化稳定策略就被认为是具有概率大于p的策略方案且开始反击最初入侵的新突变策略个体。<ref>{{cite journal |last=King |first=Oliver D. |author2=Masel, Joanna |author2link=Joanna Masel |title=The evolution of bet-hedging adaptations to rare scenarios |journal=Theoretical Population Biology|date=1 December 2007 |volume=72 |issue=4 |pages=560–575 |doi=10.1016/j.tpb.2007.08.006 |pmid=17915273 |pmc=2118055}}</ref>

第189行：第189行： −

如果整个种群都选择“针锋相对”，并且出现了一个变异者选择了“始终背叛”，那么“针锋相对”将战胜“始终背叛”。如果该变异者的种群太大，则它所占的百分比将保持很小。因此，就这两种策略而言，“针锋相对”就是一种进化均衡策略。另一方面，“始终背叛”的玩家群体可以稳定地抵御少数“针锋相对”玩家的入侵，但不能抵御大量的入侵。.<ref>{{cite book |author=Axelrod, Robert |authorlink=Robert Axelrod |title=The Evolution of Cooperation |year=1984 |isbn=0-465-02121-2 |title-link=The Evolution of Cooperation }}</ref>

+

如果整个种群都选择“针锋相对”，并且出现了一个变异者选择了“始终背叛”，那么“针锋相对”将战胜“始终背叛”。如果该变异者的种群太大，则它所占的百分比将保持很小。因此，就这两种策略而言，“针锋相对”就是一种进化稳定策略。另一方面，“始终背叛”的玩家群体可以稳定地抵御少数“针锋相对”玩家的入侵，但不能抵御大量的入侵。.<ref>{{cite book |author=Axelrod, Robert |authorlink=Robert Axelrod |title=The Evolution of Cooperation |year=1984 |isbn=0-465-02121-2 |title-link=The Evolution of Cooperation }}</ref>

−

但如果我们使用“始终合作”，那么“针锋相对”就不再是进化均衡策略了。由于大量的“针锋相对”玩家转向选择保持合作，因此“始终合作”策略在这一群体中的表现相同。最终，“始终合作”的变异者将不会被淘汰。当然，即使“始终合作”和“针锋相对”的人群可以共存，但是如果“始终背叛”的玩家只占总量的一小部分时，那么策略选择压力会对“始终合作”不利。而由于合作带来的利益要比背叛来的低，玩家们会倾向于选择“针锋相对”。

+

但如果我们使用“始终合作”，那么“针锋相对”就不再是进化稳定策略了。由于大量的“针锋相对”玩家转向选择保持合作，因此“始终合作”策略在这一群体中的表现相同。最终，“始终合作”的变异者将不会被淘汰。当然，即使“始终合作”和“针锋相对”的人群可以共存，但是如果“始终背叛”的玩家只占总量的一小部分时，那么策略选择压力会对“始终合作”不利。而由于合作带来的利益要比背叛来的低，玩家们会倾向于选择“针锋相对”。

−

~~这证明了要想将进化均衡策略的正式定义应用于具有较大策略空间的游戏中，是非常困难的，这就促使了一些人去思索替代方案。~~

+

这证明了要想将进化稳定策略的正式定义应用于具有较大策略空间的游戏中，是非常困难的，这就促使了一些人去思索替代方案。

==人类行为==

−

社会生物学和进化心理学领域试图通过进化均衡策略来解释动物和人类的行为以及社会的结构。反社会人格（长期的反社会或犯罪行为）被认为可能是这两种策略结合的后果。<ref>{{cite journal |doi=10.1017/S0140525X00039595 |author=Mealey, L. |title=The sociobiology of sociopathy: An integrated evolutionary model |journal=Behavioral and Brain Sciences |volume=18 |issue=3 |pages=523–99 |year=1995 }}</ref>

+

社会生物学和进化心理学领域试图通过进化稳定策略来解释动物和人类的行为以及社会的结构。反社会人格（长期的反社会或犯罪行为）被认为可能是这两种策略结合的后果。<ref>{{cite journal |doi=10.1017/S0140525X00039595 |author=Mealey, L. |title=The sociobiology of sociopathy: An integrated evolutionary model |journal=Behavioral and Brain Sciences |volume=18 |issue=3 |pages=523–99 |year=1995 }}</ref>

−

进化均衡策略最初被认为是用于解释生物进化论的，但是它们也可以应用于其他场景。实际上，一大类自适应动力学都具有稳定状态。因此，它们可以用来解释缺乏不受任何基因影响的人类行为。

+

进化稳定策略最初被认为是用于解释生物进化论的，但是它们也可以应用于其他场景。实际上，一大类自适应动力学都具有稳定状态。因此，它们可以用来解释缺乏不受任何基因影响的人类行为。

第243行：第243行：

==相关链接==

−

* [http://www.animalbehavioronline.com/ess.html Evolutionarily Stable Strategies] ~~动物行为的进化均衡策略：Michael~~ D. Breed的在线教科书。

+

* [http://www.animalbehavioronline.com/ess.html Evolutionarily Stable Strategies] 动物行为的进化稳定策略：Michael D. Breed的在线教科书。

−

* [https://web.archive.org/web/20060906092853/http://www.holycross.edu/departments/biology/kprestwi/behavior/ESS/ESS_index_frmset.html Game Theory and Evolutionarily Stable Strategies], ~~博弈论与进化均衡策略~~ - Kenneth N. Prestwich 圣十字学院的网站。

+

* [https://web.archive.org/web/20060906092853/http://www.holycross.edu/departments/biology/kprestwi/behavior/ESS/ESS_index_frmset.html Game Theory and Evolutionarily Stable Strategies], 博弈论与进化稳定策略 - Kenneth N. Prestwich 圣十字学院的网站。

−

*[http://knol.google.com/k/klaus-rohde/evolutionarily-stable-strategies-and/xk923bc3gp4/50# Evolutionarily stable strategies knol] ~~进化均衡策略~~

+

*[http://knol.google.com/k/klaus-rohde/evolutionarily-stable-strategies-and/xk923bc3gp4/50# Evolutionarily stable strategies knol] 进化稳定策略

第256行：第256行：

'''本词条内容源自公开资料，遵守 CC3.0协议。'''

−

[[Category:~~博弈论均衡概念~~]]

+

[[Category:博弈论稳定概念]]

[[Category:进化博弈论]]

薄荷

7,129

个编辑

更改

进化稳定策略 (查看源代码)

2021年1月9日 (六) 21:21的版本

导航菜单

搜索