更改

囚徒困境 (查看源代码)

2021年1月25日 (一) 19:47的版本

添加38字节、 2021年1月25日 (一) 19:47

→‎Strategy for the iterated prisoner's dilemma

第533行：第533行：

In the strategy called Pavlov, win-stay, lose-switch, faced with a failure to cooperate, the player switches strategy the next turn. In certain circumstances, Pavlov beats all other strategies by giving preferential treatment to co-players using a similar strategy.

−

在所谓的巴甫洛夫策略 Pavlov strategy~~中，赢~~-~~保持，输~~-~~变换，面对一次合作失败，玩家将在下一次变换策略。~~<ref>http://www.pnas.org/content/pnas/93/7/2686.full.pdf</ref>在某些情况下，{{specify|date=November 2012}}巴甫洛夫通过使用类似策略给与合作者优惠待遇打败了其他所有策略。

+

在所谓的巴甫洛夫策略 Pavlov strategy中，去输存赢 win-stay, lose-switch，面对一次合作失败，玩家将在下一次变换策略。<ref>http://www.pnas.org/content/pnas/93/7/2686.full.pdf</ref>在某些情况下，{{specify|date=November 2012}}巴甫洛夫通过使用类似策略给与合作者优惠待遇打败了其他所有策略。

第565行：第565行：

这种策略利用了这样一个事实，即在这场特殊的比赛中允许多个参赛项目，并且团队的表现由得分最高的项目来衡量(这意味着使用自我牺牲的项目是一种分数最大化的形式)。在一个只能控制一个玩家的比赛中，针锋相对当然是一个更好的策略。由于这一新规则的存在，与阿克塞尔罗德的具有深远影响的竞赛相比，这种竞赛在分析单个主体策略时也就没有什么理论意义。然而，它为在分析多主体框架下，特别是在存在干扰的情况下，如何实现协作策略提供了基础。事实上，早在这场新规则锦标赛开始之前，道金斯就在他的《自私的基因》一书中指出，如果允许多次参赛，这种策略就有可能获胜，但他说，如果提交这种策略的话，阿克塞尔罗德很可能不会允许。因为它依赖于规避囚徒困境的规则，即两个参与者之间不允许交流，南安普顿的项目可以说在开场的“十步舞”中就是这样做以认识对方的; 这只是强调了交流在改变游戏平衡方面的价值。

−

===Stochastic iterated prisoner's dilemma===

Vicky

99

个编辑

更改

囚徒困境 (查看源代码)

2021年1月25日 (一) 19:47的版本

导航菜单

搜索