更改

跳到导航 跳到搜索
删除5,534字节 、 2021年9月24日 (五) 21:30
无编辑摘要
第1行: 第1行: −
此词条由Henry初步翻译。已由Smile审校。
+
{{#seo:
 
+
|keywords=博弈论,囚徒困境 ,合作行为
 
+
|description=是博弈论分析博弈的一个代表性例子。
{| class="wikitable floatright"
+
}}
 
+
[[File:囚徒困境支付矩阵.png|right|thumb|囚徒困境支付矩阵|400px]]
|+ Prisoner's dilemma payoff matrix
  −
 
  −
! {{diagonal split header|A|B}}
  −
 
  −
! B stays<br />silent
  −
 
  −
! B<br />betrays
  −
 
  −
|-
  −
 
  −
! A stays<br />silent
  −
 
  −
| {{diagonal split header|-1|-1|transparent}}
  −
 
  −
| {{diagonal split header|-3|0|transparent}}
  −
 
  −
|-
  −
 
  −
! A<br />betrays
  −
 
  −
| {{diagonal split header|0|-3|transparent}}
  −
 
  −
| {{diagonal split header|-2|-2|transparent}}
  −
 
  −
|}
  −
 
  −
 
  −
 
  −
{| class="wikitable floatright"
  −
 
  −
|+ <font color="#ff8000"> 囚徒困境支付矩阵 Prisoner's dilemma payoff matrix</font>
  −
 
  −
! {{diagonal split header|A|B}}
  −
 
  −
! B 保持<br />缄默
  −
 
  −
! B<br />背叛
  −
 
  −
|-
  −
 
  −
! A 保持<br />缄默
  −
 
  −
| {{diagonal split header|-1|-1|transparent}}
  −
 
  −
| {{diagonal split header|-3|0|transparent}}
  −
 
  −
|-
  −
 
  −
! A<br />背叛
  −
 
  −
| {{diagonal split header|0|-3|transparent}}
  −
 
  −
| {{diagonal split header|-2|-2|transparent}}
  −
 
  −
|}
  −
 
  −
 
  −
 
   
'''囚徒困境 prisoner's dilemma'''是[[博弈论]]分析博弈的一个代表性例子,它揭示了为什么两个完全理性的个体可能不会合作,即使这样做符合他们的最大利益。它最初是由梅里尔·弗勒德 Merrill Flood和 梅文·加舍尔 Melvin Dresher于1950年在兰德公司工作时构建的。阿尔伯特.W.塔克 Albert W. Tucker将这种博弈以监禁刑罚奖励的方式正式化,并将其命名为囚徒困境 <ref>Poundstone, 1992</ref>,具体阐述如下:
 
'''囚徒困境 prisoner's dilemma'''是[[博弈论]]分析博弈的一个代表性例子,它揭示了为什么两个完全理性的个体可能不会合作,即使这样做符合他们的最大利益。它最初是由梅里尔·弗勒德 Merrill Flood和 梅文·加舍尔 Melvin Dresher于1950年在兰德公司工作时构建的。阿尔伯特.W.塔克 Albert W. Tucker将这种博弈以监禁刑罚奖励的方式正式化,并将其命名为囚徒困境 <ref>Poundstone, 1992</ref>,具体阐述如下:
   第73行: 第15行:       −
这意味着,囚犯除了监禁刑罚之外,没有机会奖励或惩罚他们的同伴,他们的决定也不会影响他们未来的声誉。因为背叛一个同伴比与他们合作能得到更大的回报,所以所有纯粹理性的、自私自利的囚犯都会背叛对方,这意味着,对于两个纯粹理性的囚犯来说,唯一可能的结果就是他们相互背叛。<ref>{{cite web|last=Milovsky|first=Nicholas|title=The Basics of Game Theory and Associated Games|url=https://issuu.com/johnsonnick895/docs/game_theory_paper|accessdate=11 February 2014}}</ref>实际上,尽管“理性的”自利行为的简单模型已经预测到了这一点,但人类在这种和类似的博弈中仍然表现出对合作行为的<font color="#ff8000">系统性偏差 systemic bias </font>。<ref name = Fehr>{{cite journal | last1=Fehr | first1= Ernst | last2=Fischbacher | first2=Urs  | date= Oct 23, 2003 | title=The Nature of human altruism |journal=Nature | volume=425 | pages=785–91 | doi=10.1038/nature02043 | url=http://www.iwp.jku.at/born/mpwfst/04/nature02043_f_born.pdf | accessdate=February 27, 2013 | pmid=14574401 | issue=6960|bibcode = 2003Natur.425..785F }}</ref><ref name = Amos>{{cite book | title=Preference, belief, and similarity: selected writings. | publisher=Massachusetts Institute of Technology Press | first1= Amos | last1=Tversky | first2=Eldar | last2=Shafir | url=http://cseweb.ucsd.edu/~gary/PAPER-SUGGESTIONS/Preference,%20Belief,%20and%20Similarity%20Selected%20Writings%20(Bradford%20Books).pdf  | year=2004 | isbn=9780262700931 | accessdate=February 27, 2013}}</ref><ref name="Ahn">{{cite journal |last1 = Toh-Kyeong|first1 = Ahn|last2 = Ostrom|first2 = Elinor|last3 = Walker|first3 = James|date = Sep 5, 2002|title = Incorporating Motivational Heterogeneity into Game-Theoretic Models of Collective Action|journal = Public Choice|volume = 117|issue = 3–4|pages = 295–314|doi =10.1023/b:puch.0000003739.54365.fd |url = http://www.indiana.edu/~workshop/seminars/papers/ahnostromwalker_092402.pdf|accessdate = June 27, 2015|hdl = 10535/4697}}</ref><ref name="Hessel">{{cite journal|last1 = Oosterbeek|first1 = Hessel|last2 = Sloof|first2 = Randolph|last3 = Van de Kuilen|first3 = Gus|date = Dec 3, 2003|title = Cultural Differences in Ultimatum Game Experiments: Evidence from a Meta-Analysis|journal = Experimental Economics|volume = 7|issue = 2|pages = 171–88|doi = 10.1023/B:EXEC.0000026978.14316.74|url = http://www.econ.nagoya-cu.ac.jp/~yhamagu/ultimatum.pdf|accessdate = February 27, 2013|url-status = dead|archiveurl = https://web.archive.org/web/20130512175243/http://www.econ.nagoya-cu.ac.jp/~yhamagu/ultimatum.pdf|archivedate = May 12, 2013}}</ref>自从在兰德公司首次进行这项测试以来,人们就已经知道了这种对合作的偏见; 参与测试的秘书们相互信任,为了最好的共同的目标而努力。<ref>{{Cite book | url=https://books.google.com/?id=WIhZlB86nJwC&pg=PT96&lpg=PT96&dq=rand+secretaries+prisoner%27s+dilemma#v=onepage |title = Why Most Things Fail|isbn = 9780571266142|last1 = Ormerod|first1 = Paul|date = 2010-12-22}}</ref>囚徒困境成为大量实验研究的焦点。<ref>Deutsch, M. (1958). Trust and suspicion. Journal of Conflict Resolution, 2(4), 265–279. https://doi.org/10.1177/002200275800200401</ref> <ref>Rapoport, A., & Chammah, A. M. (1965). Prisoner’s Dilemma: A study of conflict and cooperation. Ann Arbor, MI: University of Michigan Press.</ref>
+
这意味着,囚犯除了监禁刑罚之外,没有机会奖励或惩罚他们的同伴,他们的决定也不会影响他们未来的声誉。因为背叛一个同伴比与他们合作能得到更大的回报,所以所有纯粹理性的、自私自利的囚犯都会背叛对方,这意味着,对于两个纯粹理性的囚犯来说,唯一可能的结果就是他们相互背叛。<ref>{{cite web|last=Milovsky|first=Nicholas|title=The Basics of Game Theory and Associated Games|url=https://issuu.com/johnsonnick895/docs/game_theory_paper|accessdate=11 February 2014}}</ref>实际上,尽管“理性的”自利行为的简单模型已经预测到了这一点,但人类在这种和类似的博弈中仍然表现出对合作行为的系统性偏差 systemic bias。<ref name = Fehr>{{cite journal | last1=Fehr | first1= Ernst | last2=Fischbacher | first2=Urs  | date= Oct 23, 2003 | title=The Nature of human altruism |journal=Nature | volume=425 | pages=785–91 | doi=10.1038/nature02043 | url=http://www.iwp.jku.at/born/mpwfst/04/nature02043_f_born.pdf | accessdate=February 27, 2013 | pmid=14574401 | issue=6960|bibcode = 2003Natur.425..785F }}</ref><ref name = Amos>{{cite book | title=Preference, belief, and similarity: selected writings. | publisher=Massachusetts Institute of Technology Press | first1= Amos | last1=Tversky | first2=Eldar | last2=Shafir | url=http://cseweb.ucsd.edu/~gary/PAPER-SUGGESTIONS/Preference,%20Belief,%20and%20Similarity%20Selected%20Writings%20(Bradford%20Books).pdf  | year=2004 | isbn=9780262700931 | accessdate=February 27, 2013}}</ref><ref name="Ahn">{{cite journal |last1 = Toh-Kyeong|first1 = Ahn|last2 = Ostrom|first2 = Elinor|last3 = Walker|first3 = James|date = Sep 5, 2002|title = Incorporating Motivational Heterogeneity into Game-Theoretic Models of Collective Action|journal = Public Choice|volume = 117|issue = 3–4|pages = 295–314|doi =10.1023/b:puch.0000003739.54365.fd |url = http://www.indiana.edu/~workshop/seminars/papers/ahnostromwalker_092402.pdf|accessdate = June 27, 2015|hdl = 10535/4697}}</ref><ref name="Hessel">{{cite journal|last1 = Oosterbeek|first1 = Hessel|last2 = Sloof|first2 = Randolph|last3 = Van de Kuilen|first3 = Gus|date = Dec 3, 2003|title = Cultural Differences in Ultimatum Game Experiments: Evidence from a Meta-Analysis|journal = Experimental Economics|volume = 7|issue = 2|pages = 171–88|doi = 10.1023/B:EXEC.0000026978.14316.74|url = http://www.econ.nagoya-cu.ac.jp/~yhamagu/ultimatum.pdf|accessdate = February 27, 2013|url-status = dead|archiveurl = https://web.archive.org/web/20130512175243/http://www.econ.nagoya-cu.ac.jp/~yhamagu/ultimatum.pdf|archivedate = May 12, 2013}}</ref>自从在兰德公司首次进行这项测试以来,人们就已经知道了这种对合作的偏见; 参与测试的秘书们相互信任,为了最好的共同的目标而努力。<ref>{{Cite book | url=https://books.google.com/?id=WIhZlB86nJwC&pg=PT96&lpg=PT96&dq=rand+secretaries+prisoner%27s+dilemma#v=onepage |title = Why Most Things Fail|isbn = 9780571266142|last1 = Ormerod|first1 = Paul|date = 2010-12-22}}</ref>囚徒困境成为大量实验研究的焦点。<ref>Deutsch, M. (1958). Trust and suspicion. Journal of Conflict Resolution, 2(4), 265–279. https://doi.org/10.1177/002200275800200401</ref> <ref>Rapoport, A., & Chammah, A. M. (1965). Prisoner’s Dilemma: A study of conflict and cooperation. Ann Arbor, MI: University of Michigan Press.</ref>
      第147行: 第89行:       −
捐赠博弈可能适用于市场。假设种植者X 种橘子,种植者Y 种苹果。苹果对橙子种植者 X 的<font color="#ff8000">边际效用 marginal utility</font>是''b'',“b”比橙子的边际效用''c''高,因为X有橙子剩余而没有苹果。同样地,对于苹果种植者Y来说,橙子的边际效用是''b'',而苹果的边际效用是''c''。 如果X和Y签约交换一个苹果和一个橙子,并且每个人都完成了交易,那么每个人都会得到''b-c''的收益。如果一方违约没有按照承诺交货,那么这个违约者将得到''b''的收益,而合作者将失去''c''的收益。 如果两者都违约,那么谁也不会得到或失去任何东西。
+
捐赠博弈可能适用于市场。假设种植者X 种橘子,种植者Y 种苹果。苹果对橙子种植者 X 的边际效用 marginal utility是''b'',“b”比橙子的边际效用''c''高,因为X有橙子剩余而没有苹果。同样地,对于苹果种植者Y来说,橙子的边际效用是''b'',而苹果的边际效用是''c''。 如果X和Y签约交换一个苹果和一个橙子,并且每个人都完成了交易,那么每个人都会得到''b-c''的收益。如果一方违约没有按照承诺交货,那么这个违约者将得到''b''的收益,而合作者将失去''c''的收益。 如果两者都违约,那么谁也不会得到或失去任何东西。
    
<br>
 
<br>
第165行: 第107行:       −
与标准的囚徒困境不同,在重复囚徒困境中,叛变策略是严重违反直觉的,以至于不能很好地预测人类玩家的行为。然而,在标准的经济理论中,这是唯一正确的答案。具有固定次数 N的重复囚徒困境中的<font color="#ff8000">超理性 superrational</font>策略是与超理性对手进行合作,在''N''很大的限制下,实验结果的策略与超理性结果的策略一致,而不是博弈论的理性结果。
+
与标准的囚徒困境不同,在重复囚徒困境中,叛变策略是严重违反直觉的,以至于不能很好地预测人类玩家的行为。然而,在标准的经济理论中,这是唯一正确的答案。具有固定次数 N的重复囚徒困境中的超理性 superrational策略是与超理性对手进行合作,在''N''很大的限制下,实验结果的策略与超理性结果的策略一致,而不是博弈论的理性结果。
      第171行: 第113行:       −
根据《美国经济评论》于2019年进行的一项实验研究,该实验中通过完美的监控测试了现实中被用在重复囚徒困境情况下的策略,监测选择的策略总是背叛,针锋相对的和 <font color="#ff8000"> 冷酷触发策略 Grim trigger</font>。受试者选择的策略取决于博弈的参数。<ref>{{Cite journal|last=Dal Bó|first=Pedro|last2=Fréchette|first2=Guillaume R.|date=2019|title=Strategy Choice in the Infinitely Repeated Prisoner's Dilemma|journal=American Economic Review|language=en|volume=109|issue=11|pages=3929–3952|doi=10.1257/aer.20181480|issn=0002-8282}}</ref>
+
根据《美国经济评论》于2019年进行的一项实验研究,该实验中通过完美的监控测试了现实中被用在重复囚徒困境情况下的策略,监测选择的策略总是背叛,针锋相对的和 冷酷触发策略 Grim trigger。受试者选择的策略取决于博弈的参数。<ref>{{Cite journal|last=Dal Bó|first=Pedro|last2=Fréchette|first2=Guillaume R.|date=2019|title=Strategy Choice in the Infinitely Repeated Prisoner's Dilemma|journal=American Economic Review|language=en|volume=109|issue=11|pages=3929–3952|doi=10.1257/aer.20181480|issn=0002-8282}}</ref>
      第200行: 第142行:       −
在所谓的<font color="#ff8000">巴甫洛夫策略 Pavlov strategy</font>中,<font color="#ff8000">去输存赢 win-stay, lose-switch</font>,面对一次合作失败,玩家将在下一次变换策略。<ref>http://www.pnas.org/content/pnas/93/7/2686.full.pdf</ref>在某些情况下,巴甫洛夫通过使用类似策略给与合作者优惠待遇打败了其他所有策略。
+
在所谓的巴甫洛夫策略 Pavlov strategy中,去输存赢 win-stay, lose-switch,面对一次合作失败,玩家将在下一次变换策略。<ref>http://www.pnas.org/content/pnas/93/7/2686.full.pdf</ref>在某些情况下,巴甫洛夫通过使用类似策略给与合作者优惠待遇打败了其他所有策略。
      第208行: 第150行:       −
* [[蒙特卡罗方法]]已经对种群进行了模拟,分数低的个体死亡,分数高的个体繁殖(<font color="#ff8000">遗传算法 genetic algorithm </font>用于寻找一个最佳策略)。最终群体中的算法组合通常取决于初始总体的组合。引入突变(繁殖过程中的随机变异)可以减少对初始种群的依赖性。使用这种系统进行经验性实验往往会为针锋相对的玩家带来麻烦(见Chess 1988),{{Clarify|date=August 2016}},但是没有分析证据表明这种情况会一直发生。<ref>{{Citation|last=Wu|first=Jiadong|title=Cooperation on the Monte Carlo Rule: Prisoner's Dilemma Game on the Grid|date=2019|work=Theoretical Computer Science|volume=1069|pages=3–15|editor-last=Sun|editor-first=Xiaoming|publisher=Springer Singapore|language=en|doi=10.1007/978-981-15-0105-0_1|isbn=978-981-15-0104-3|last2=Zhao|first2=Chengye|editor2-last=He|editor2-first=Kun|editor3-last=Chen|editor3-first=Xiaoyun}}</ref>
+
* [[蒙特卡罗方法]]已经对种群进行了模拟,分数低的个体死亡,分数高的个体繁殖(遗传算法 genetic algorithm用于寻找一个最佳策略)。最终群体中的算法组合通常取决于初始总体的组合。引入突变(繁殖过程中的随机变异)可以减少对初始种群的依赖性。使用这种系统进行经验性实验往往会为针锋相对的玩家带来麻烦(见Chess 1988),{{Clarify|date=August 2016}},但是没有分析证据表明这种情况会一直发生。<ref>{{Citation|last=Wu|first=Jiadong|title=Cooperation on the Monte Carlo Rule: Prisoner's Dilemma Game on the Grid|date=2019|work=Theoretical Computer Science|volume=1069|pages=3–15|editor-last=Sun|editor-first=Xiaoming|publisher=Springer Singapore|language=en|doi=10.1007/978-981-15-0105-0_1|isbn=978-981-15-0104-3|last2=Zhao|first2=Chengye|editor2-last=He|editor2-first=Kun|editor3-last=Chen|editor3-first=Xiaoyun}}</ref>
      −
尽管针锋相对被认为是最有力的基本策略,来自英格兰南安普敦大学的一个团队在20周年的重复囚徒困境竞赛中提出了一个新策略,这个策略被证明比针锋相对更为成功。这种策略依赖于程序之间的串通,以获得单个程序的最高分数。这所大学提交了60个程序,这些程序的设计目的是在比赛开始时通过一系列的5到10个动作来互相认识。<ref>{{cite press release|url= http://www.southampton.ac.uk/mediacentre/news/2004/oct/04_151.shtml|publisher=University of Southampton|title=University of Southampton team wins Prisoner's Dilemma competition|date=7 October 2004|url-status=dead|archive-url= https://web.archive.org/web/20140421055745/http://www.southampton.ac.uk/mediacentre/news/2004/oct/04_151.shtml|archive-date=2014-04-21}}</ref>一旦认识建立,一个程序总是合作,另一个程序总是叛变,保证叛变者得到最多的分数。如果这个程序意识到它正在和一个非南安普顿的球员比赛,它会不断地叛变,试图最小化与之竞争的程序的得分。因此,2004年囚徒困境锦标赛的结果显示了南安普敦大学战略位居前三名,尽管它比冷酷战略赢得更少,输的更多。(在囚徒困境锦标赛中,比赛的目的不是“赢”比赛——这一点频繁叛变很容易实现)。此外,即使没有软件策略之间的暗中串通(南安普顿队利用了这一点) ,针锋相对并不总是任何特定锦标赛的绝对赢家; 更准确地说,它是在一系列锦标赛中的长期结果超过了它的竞争对手。(在任何一个事件中,一个给定的策略可以比针锋相对稍微更好地适应竞争,但是针锋相对更稳健)。这同样适用于带有宽恕变量的针锋相对,和其他最佳策略: 在任何特定的一天,他们可能不会“赢得”一个特定的混合反战略。另一种方法是使用达尔文 Darwinian的<font color="#ff8000"> ESS模拟 ESS simulation</font>。在这样的模拟中,针锋相对几乎总是占主导地位,尽管讨厌的策略会在人群中漂移,因为使用针锋相对策略的人群可以通过非报复性的好策略进行渗透,这反过来使他们容易成为讨厌策略的猎物。理查德·道金斯 Richard Dawkins指出,在这里,没有静态的混合策略会形成一个稳定的平衡,系统将始终在边界之间振荡。这种策略最终在比赛中获得了前三名的成绩,或者是接近垫底的成绩。
+
尽管针锋相对被认为是最有力的基本策略,来自英格兰南安普敦大学的一个团队在20周年的重复囚徒困境竞赛中提出了一个新策略,这个策略被证明比针锋相对更为成功。这种策略依赖于程序之间的串通,以获得单个程序的最高分数。这所大学提交了60个程序,这些程序的设计目的是在比赛开始时通过一系列的5到10个动作来互相认识。<ref>{{cite press release|url= http://www.southampton.ac.uk/mediacentre/news/2004/oct/04_151.shtml|publisher=University of Southampton|title=University of Southampton team wins Prisoner's Dilemma competition|date=7 October 2004|url-status=dead|archive-url= https://web.archive.org/web/20140421055745/http://www.southampton.ac.uk/mediacentre/news/2004/oct/04_151.shtml|archive-date=2014-04-21}}</ref>一旦认识建立,一个程序总是合作,另一个程序总是叛变,保证叛变者得到最多的分数。如果这个程序意识到它正在和一个非南安普顿的球员比赛,它会不断地叛变,试图最小化与之竞争的程序的得分。因此,2004年囚徒困境锦标赛的结果显示了南安普敦大学战略位居前三名,尽管它比冷酷战略赢得更少,输的更多。(在囚徒困境锦标赛中,比赛的目的不是“赢”比赛——这一点频繁叛变很容易实现)。此外,即使没有软件策略之间的暗中串通(南安普顿队利用了这一点) ,针锋相对并不总是任何特定锦标赛的绝对赢家; 更准确地说,它是在一系列锦标赛中的长期结果超过了它的竞争对手。(在任何一个事件中,一个给定的策略可以比针锋相对稍微更好地适应竞争,但是针锋相对更稳健)。这同样适用于带有宽恕变量的针锋相对,和其他最佳策略: 在任何特定的一天,他们可能不会“赢得”一个特定的混合反战略。另一种方法是使用达尔文 Darwinian的 ESS模拟 ESS simulation。在这样的模拟中,针锋相对几乎总是占主导地位,尽管讨厌的策略会在人群中漂移,因为使用针锋相对策略的人群可以通过非报复性的好策略进行渗透,这反过来使他们容易成为讨厌策略的猎物。理查德·道金斯 Richard Dawkins指出,在这里,没有静态的混合策略会形成一个稳定的平衡,系统将始终在边界之间振荡。这种策略最终在比赛中获得了前三名的成绩,或者是接近垫底的成绩。
      第236行: 第178行:       −
针锋相对是一种零决定策略,在不获得超越其他玩家优势的意义下是“公平”的。然而,零决定策略空间还包含这样的策略:在两个玩家的情况下,可以允许一个玩家单方面设置另一个玩家的分数,或者强迫进化的玩家获得比他自己的分数低一些的收益。被勒索的玩家可能会背叛,但会因此获得较低的回报并且受到伤害。因此,勒索的解决方案将重复囚徒困境转化为一种<font color="#ff8000">最后通牒博弈 ultimatum game </font>。具体来说,''X''能够选择一种策略,对于这种策略,<math>D(P,Q,\beta S_y+\gamma U)=0</math>单方面地将<math>s_y</math>设置为一个特定值范围内的特定值,与''Y''的策略无关,为''X''提供了“勒索”玩家''Y''的机会(反之亦然)。(事实证明,如果''X''试图将<math>s_x</math>设置为一个特定的值,那么可能的范围要小得多,只包括完全合作或完全叛变。<ref name="Press2012"/>)
+
针锋相对是一种零决定策略,在不获得超越其他玩家优势的意义下是“公平”的。然而,零决定策略空间还包含这样的策略:在两个玩家的情况下,可以允许一个玩家单方面设置另一个玩家的分数,或者强迫进化的玩家获得比他自己的分数低一些的收益。被勒索的玩家可能会背叛,但会因此获得较低的回报并且受到伤害。因此,勒索的解决方案将重复囚徒困境转化为一种最后通牒博弈 ultimatum game。具体来说,''X''能够选择一种策略,对于这种策略,<math>D(P,Q,\beta S_y+\gamma U)=0</math>单方面地将<math>s_y</math>设置为一个特定值范围内的特定值,与''Y''的策略无关,为''X''提供了“勒索”玩家''Y''的机会(反之亦然)。(事实证明,如果''X''试图将<math>s_x</math>设置为一个特定的值,那么可能的范围要小得多,只包括完全合作或完全叛变。<ref name="Press2012"/>)
      第335行: 第277行:  
===多玩家困境===
 
===多玩家困境===
   −
许多现实生活中的困境牵涉到多个参与者。<ref>Gokhale CS, Traulsen A. Evolutionary games in the multiverse. Proceedings of the National Academy of Sciences. 2010 Mar 23. 107(12):5500–04.</ref>尽管具有隐喻性,但哈丁的<font color="#ff8000">公地悲剧 tragedy of the commons</font>可以看作是囚徒困境多个参与者的一个例子: 每个村民做出选择是为了个人利益还是克制。对于一致(甚至频繁)叛变的集体回报是非常低的(代表了对“公共资源”的破坏)。大多数人可能会遇到的公地困境是在一个共用的房子里洗碗。通过不洗碗,个人可以节省时间,但如果每个居民都选择这种行为,那么集体的代价是任何人都没有干净的盘子。
+
许多现实生活中的困境牵涉到多个参与者。<ref>Gokhale CS, Traulsen A. Evolutionary games in the multiverse. Proceedings of the National Academy of Sciences. 2010 Mar 23. 107(12):5500–04.</ref>尽管具有隐喻性,但哈丁的公地悲剧 tragedy of the commons可以看作是囚徒困境多个参与者的一个例子: 每个村民做出选择是为了个人利益还是克制。对于一致(甚至频繁)叛变的集体回报是非常低的(代表了对“公共资源”的破坏)。大多数人可能会遇到的公地困境是在一个共用的房子里洗碗。通过不洗碗,个人可以节省时间,但如果每个居民都选择这种行为,那么集体的代价是任何人都没有干净的盘子。
      第351行: 第293行:  
侯世达 Douglas Hofstadter <ref name="dh">{{cite book | first=Douglas R. | last=Hofstadter| authorlink=Douglas Hofstadter | title= Metamagical Themas: questing for the essence of mind and pattern | publisher= Bantam Dell Pub Group| year=1985 | isbn=978-0-465-04566-2|chapter= Ch.29 ''The Prisoner's Dilemma Computer Tournaments and the Evolution of Cooperation''.| title-link=Metamagical Themas}}</ref>曾经指出,人们通常会发现诸如囚徒困境的问题,比如,当它以一个简单囚徒困境博弈的形式,或者以权衡的方式表现出来时,会更容易理解。他使用的几个例子之一是“封闭袋子交换” :
 
侯世达 Douglas Hofstadter <ref name="dh">{{cite book | first=Douglas R. | last=Hofstadter| authorlink=Douglas Hofstadter | title= Metamagical Themas: questing for the essence of mind and pattern | publisher= Bantam Dell Pub Group| year=1985 | isbn=978-0-465-04566-2|chapter= Ch.29 ''The Prisoner's Dilemma Computer Tournaments and the Evolution of Cooperation''.| title-link=Metamagical Themas}}</ref>曾经指出,人们通常会发现诸如囚徒困境的问题,比如,当它以一个简单囚徒困境博弈的形式,或者以权衡的方式表现出来时,会更容易理解。他使用的几个例子之一是“封闭袋子交换” :
   −
<blockqoute>两人相遇并交换包裹,事先知道一个包里装着钱,一个装着订单。任一玩家都可选择尊重交易,放入事先约定的东西;也可以选择背叛,交换空的公文包。</blockqoute>
+
<blockquote>两人相遇并交换包裹,事先知道一个包里装着钱,一个装着订单。任一玩家都可选择尊重交易,放入事先约定的东西;也可以选择背叛,交换空的公文包。</blockquote>
      第369行: 第311行:     
英国电视节目《相信我 Trust Me》、《阴影 Shafted》、《银行工作 The Bank Job》和《黄金球 Golden Balls》以及美国电视节目《单身公寓 Bachelor Pad》和《全部拿走 Take It All》也采用了这种奖励矩阵。一个经济学家团队分析了“黄金球”系列的游戏数据,他们发现,现实生活中,合作对于金额而言“惊人地高” ,但在游戏的背景下,相对较低。<ref>{{cite journal | ssrn=1592456 | title=Split or Steal? Cooperative Behavior When the Stakes Are Large | author=Van den Assem, Martijn J. | journal=Management Science |date=January 2012 | volume=58 | issue=1 | pages=2–20 | doi=10.1287/mnsc.1110.1413| url=http://faculty.chicagobooth.edu/richard.thaler/research/pdf/Split%20or%20Steal%20Cooperative%20Behavior%20When%20the%20Stakes%20Are%20Large.pdf }}</ref>
 
英国电视节目《相信我 Trust Me》、《阴影 Shafted》、《银行工作 The Bank Job》和《黄金球 Golden Balls》以及美国电视节目《单身公寓 Bachelor Pad》和《全部拿走 Take It All》也采用了这种奖励矩阵。一个经济学家团队分析了“黄金球”系列的游戏数据,他们发现,现实生活中,合作对于金额而言“惊人地高” ,但在游戏的背景下,相对较低。<ref>{{cite journal | ssrn=1592456 | title=Split or Steal? Cooperative Behavior When the Stakes Are Large | author=Van den Assem, Martijn J. | journal=Management Science |date=January 2012 | volume=58 | issue=1 | pages=2–20 | doi=10.1287/mnsc.1110.1413| url=http://faculty.chicagobooth.edu/richard.thaler/research/pdf/Split%20or%20Steal%20Cooperative%20Behavior%20When%20the%20Stakes%20Are%20Large.pdf }}</ref>
        第385行: 第326行:     
对称的协调游戏包括猎鹿 Stag hunt和巴赫 Bach或斯特拉文斯基 Stravinsky。
 
对称的协调游戏包括猎鹿 Stag hunt和巴赫 Bach或斯特拉文斯基 Stravinsky。
        第397行: 第337行:  
<br>
 
<br>
   −
==Software==
+
==软件==
软件
  −
 
  −
 
  −
Several software packages have been created to run prisoner's dilemma simulations and tournaments, some of which have available source code.
  −
 
  −
Several software packages have been created to run prisoner's dilemma simulations and tournaments, some of which have available source code.
      
已经有一些可以用来运行囚徒困境模拟和比赛的软件包,其中一些有可用的源代码。
 
已经有一些可以用来运行囚徒困境模拟和比赛的软件包,其中一些有可用的源代码。
第417行: 第351行:       −
==In fiction==
+
==在小说中==
在小说中
+
汉努·拉贾尼埃米 Hannu Rajaniemi将他的《量子窃贼》三部曲的开场场景设置在一个“囚徒困境”中。该系列的主题被描述为“双重宇宙的不足” ,最终的对手是一个叫做全面背叛者的角色。作为一个处理这个问题的艺术家,拉贾尼埃米尤其有趣,因为他是剑桥大学培养的数学家,拥有数学物理学博士学位——物质和信息的可互换性是这本书的一个主要特征,它发生在后奇点 post-singularity的未来。该系列的第一本书于2010年出版,其续集《分形王子》和《因果天使》分别于2012年和2014年出版。
[[Hannu Rajaniemi]] set the opening scene of his ''[[The Quantum Thief]]'' trilogy in a "dilemma prison". The main theme of the series has been described as the "inadequacy of a binary universe" and the ultimate antagonist is a character called the All-Defector.  Rajaniemi is particularly interesting as an artist treating this subject in that he is a Cambridge-trained mathematician and holds a PhD in [[mathematical physics]]&nbsp;– the interchangeability of matter and information is a major feature of the books, which take place in a "post-singularity" future.  The first book in the series was published in 2010, with the two sequels, ''[[The Fractal Prince]]'' and ''[[The Causal Angel]]'', published in 2012 and 2014, respectively.
     −
Hannu Rajaniemi set the opening scene of his The Quantum Thief trilogy in a "dilemma prison". The main theme of the series has been described as the "inadequacy of a binary universe" and the ultimate antagonist is a character called the All-Defector.  Rajaniemi is particularly interesting as an artist treating this subject in that he is a Cambridge-trained mathematician and holds a PhD in mathematical physics&nbsp;– the interchangeability of matter and information is a major feature of the books, which take place in a "post-singularity" future.  The first book in the series was published in 2010, with the two sequels, The Fractal Prince and The Causal Angel, published in 2012 and 2014, respectively.
  −
  −
汉努·拉贾尼埃米 Hannu Rajaniemi将他的《量子窃贼》三部曲的开场场景设置在一个“囚徒困境”中。该系列的主题被描述为“双重宇宙的不足” ,最终的对手是一个叫做全面背叛者的角色。作为一个处理这个问题的艺术家,拉贾尼埃米尤其有趣,因为他是剑桥大学培养的数学家,拥有数学物理学博士学位——物质和信息的可互换性是这本书的一个主要特征,它发生在<font color="#ff8000">后奇点post-singularity</font>的未来。该系列的第一本书于2010年出版,其续集《分形王子》和《因果天使》分别于2012年和2014年出版。
  −
  −
  −
  −
A game modeled after the (iterated) prisoner's dilemma is a central focus of the 2012 video game ''[[Zero Escape: Virtue's Last Reward]]'' and a minor part in its 2016 sequel ''[[Zero Escape: Zero Time Dilemma]]''.
  −
  −
A game modeled after the (iterated) prisoner's dilemma is a central focus of the 2012 video game Zero Escape: Virtue's Last Reward and a minor part in its 2016 sequel Zero Escape: Zero Time Dilemma.
      
一个(重复)囚徒困境博弈的模型是2012年电子游戏《零度逃脱: 美德的最后奖励》的重点,也是2016年续集《零度逃脱: 极限脱出刻之困境》的一个次要部分。
 
一个(重复)囚徒困境博弈的模型是2012年电子游戏《零度逃脱: 美德的最后奖励》的重点,也是2016年续集《零度逃脱: 极限脱出刻之困境》的一个次要部分。
       +
在特伦顿·李·斯图尔特 Trenton Lee Stewart的《神秘的本尼迪克特社会和囚徒困境 The Mysterious Benedict Society and the Prisoner's Dilemma》中,主要角色从玩一个版本的游戏开始,然后一起逃离“监狱”。后来他们变成了真正的囚犯,再次越狱。
   −
In ''The Mysterious Benedict Society and the Prisoner's Dilemma'' by [[Trenton Lee Stewart]], the main characters start by playing a version of the game and escaping from the "prison" altogether. Later they become actual prisoners and escape once again.
  −
  −
In The Mysterious Benedict Society and the Prisoner's Dilemma by Trenton Lee Stewart, the main characters start by playing a version of the game and escaping from the "prison" altogether. Later they become actual prisoners and escape once again.
  −
  −
在特伦顿·李·斯图尔特 Trenton Lee Stewart的《神秘的本尼迪克特社会和囚徒困境》中,主要角色从玩一个版本的游戏开始,然后一起逃离“监狱”。后来他们变成了真正的囚犯,再次越狱。
  −
  −
  −
  −
In ''[[The Adventure Zone]]: Balance'' during ''The Suffering Game'' subarc, the player characters are twice presented with the prisoner's dilemma during their time in two liches' domain, once cooperating and once defecting.
  −
  −
In The Adventure Zone: Balance during The Suffering Game subarc, the player characters are twice presented with the prisoner's dilemma during their time in two liches' domain, once cooperating and once defecting.
      
在冒险区: 苦难游戏的平衡中,玩家角色在他们在两个领域的时间内两次呈现出囚徒困境,一次是合作,一次是背叛。
 
在冒险区: 苦难游戏的平衡中,玩家角色在他们在两个领域的时间内两次呈现出囚徒困境,一次是合作,一次是背叛。
       +
在作者詹姆斯·S·A·科里·提亚玛特 James S. A. Corey Tiamat的《愤怒 Wrath》中的第八部小说中,温斯顿•杜阿尔特 Winston Duarte向他14岁的女儿特蕾莎 Teresa解释了她面临的囚徒困境,来训练她的战略思维能力。
   −
In the 8th novel from the author James S. A. Corey [[Tiamat's Wrath]] . Winston Duarte explains the prisoners dilemma in his 14-year-old daughter, Teresa, to train her in strategic thinking. {{cn|date=April 2020}}
     −
In the 8th novel from the author James S. A. Corey Tiamat's Wrath . Winston Duarte explains the prisoners dilemma in his 14-year-old daughter, Teresa, to train her in strategic thinking.
+
==请参阅==
   −
在作者詹姆斯·S·A·科里·提亚玛特 James S. A. Corey Tiamat的《愤怒》中的第八部小说中,温斯顿•杜阿尔特 Winston Duarte向他14岁的女儿特蕾莎 Teresa解释了她面临的囚徒困境,来训练她的战略思维能力。
  −
  −
  −
==See also==
  −
请参阅
   
{{div col|colwidth=18em}}
 
{{div col|colwidth=18em}}
    
* [[Abilene paradox]]
 
* [[Abilene paradox]]
<font color="#ff8000"> 阿背伦悖论</font>
+
阿背伦悖论
 
* [[Centipede game]]
 
* [[Centipede game]]
<font color="#ff8000"> 蜈蚣博弈</font>
+
蜈蚣博弈
 
* [[Christmas truce]]
 
* [[Christmas truce]]
<font color="#ff8000"> 圣诞休战</font>
+
圣诞休战
 
* [[Folk theorem (game theory)]]
 
* [[Folk theorem (game theory)]]
<font color="#ff8000"> 无名氏定理(博弈论)/font>
+
无名氏定理(博弈论)/font>
 
* [[Free-rider problem]]
 
* [[Free-rider problem]]
<font color="#ff8000"> 搭便车问题</font>
+
搭便车问题
 
* [[Hobbesian trap]]
 
* [[Hobbesian trap]]
]<font color="#ff8000"> 霍布斯主义陷阱</font>
+
] 霍布斯主义陷阱
 
* [[Innocent prisoner's dilemma]]
 
* [[Innocent prisoner's dilemma]]
<font color="#ff8000"> 无辜囚徒困局</font>
+
无辜囚徒困局
 
* [[Liar Game]]
 
* [[Liar Game]]
<font color="#ff8000">说谎者博弈</font>
+
说谎者博弈
 
* [[Optional prisoner's dilemma]]
 
* [[Optional prisoner's dilemma]]
<font color="#ff8000"> 可选择囚徒困境</font>
+
可选择囚徒困境
 
* [[Robert H. Frank#Prisoner's dilemma and cooperation|Prisoner's dilemma and cooperation]]
 
* [[Robert H. Frank#Prisoner's dilemma and cooperation|Prisoner's dilemma and cooperation]]
罗伯特·H·弗兰克囚徒的困境和合作|<font color="#ff8000"> 囚徒困境</font>和合作
+
罗伯特·H·弗兰克囚徒的困境和合作| 囚徒困境和合作
 
* [[Public goods game]]
 
* [[Public goods game]]
<font color="#ff8000"> 公共商品博弈</font>
+
公共商品博弈
 
* [[Gift-exchange game]]
 
* [[Gift-exchange game]]
<font color="#ff8000"> 互利博弈</font>
+
互利博弈
 
* [[Reciprocal altruism]]
 
* [[Reciprocal altruism]]
<font color="#ff8000"> 相互利他行为</font>
+
相互利他行为
 
* [[Social preferences]]
 
* [[Social preferences]]
<font color="#ff8000"> 社会偏好</font>
+
社会偏好
 
* [[Swift trust theory]]
 
* [[Swift trust theory]]
<font color="#ff8000"> 快速信任理论</font>
+
快速信任理论
 
* [[Unscrupulous diner's dilemma]]
 
* [[Unscrupulous diner's dilemma]]
]<font color="#ff8000"> 无道德食客困境</font>
+
] 无道德食客困境
 
{{div col end}}
 
{{div col end}}
         −
==References==
+
==参考文献==
==参考==
  −
{{notelist}}
      
{{reflist|colwidth=30em}}
 
{{reflist|colwidth=30em}}
第506行: 第413行:       −
==Further reading==
   
==拓展阅读==
 
==拓展阅读==
 
{{refbegin|30em}}
 
{{refbegin|30em}}
   −
* [[S.M. Amadae|Amadae, S.]] (2016). 'Prisoner's Dilemma,' ''Prisoners of Reason.''  [[Cambridge University Press]], NY, pp.&nbsp;24–61.
+
* S.M. Amadae (2016). 'Prisoner's Dilemma,' ''Prisoners of Reason.''  Cambridge University Press, NY, pp.&nbsp;24–61.
    
* {{cite book |first1=Robert |last1=Aumann |authorlink=Robert Aumann |chapter=Acceptable points in general cooperative ''n''-person games |editor1-first=R. D. |editor1-last=Luce |editor2-first=A. W. |editor2-last=Tucker |title=Contributions to the Theory 23 of Games IV |series=Annals of Mathematics Study |volume=40 |pages=287–324 |publisher=Princeton University Press |location=Princeton NJ |year=1959 |mr=0104521}}
 
* {{cite book |first1=Robert |last1=Aumann |authorlink=Robert Aumann |chapter=Acceptable points in general cooperative ''n''-person games |editor1-first=R. D. |editor1-last=Luce |editor2-first=A. W. |editor2-last=Tucker |title=Contributions to the Theory 23 of Games IV |series=Annals of Mathematics Study |volume=40 |pages=287–324 |publisher=Princeton University Press |location=Princeton NJ |year=1959 |mr=0104521}}
   −
* [[Robert Axelrod|Axelrod, R.]] (1984). ''[[The Evolution of Cooperation]]''. {{isbn|0-465-02121-2}}
+
* Robert Axelrod(1984). ''[[The Evolution of Cooperation]]''.  
   −
* [[Cristina Bicchieri|Bicchieri, Cristina]] (1993). Rationality and Coordination. [[Cambridge University Press]].
+
* Cristina Bicchieri (1993). Rationality and Coordination. Cambridge University Press.
    
* {{cite journal |first1=David M. |last1=Chess |date=December 1988 |title=Simulating the evolution of behavior: the iterated prisoners' dilemma problem |url=http://www.complex-systems.com/pdf/02-6-4.pdf |journal=Complex Systems |volume=2 |issue=6 |pages=663–70}}
 
* {{cite journal |first1=David M. |last1=Chess |date=December 1988 |title=Simulating the evolution of behavior: the iterated prisoners' dilemma problem |url=http://www.complex-systems.com/pdf/02-6-4.pdf |journal=Complex Systems |volume=2 |issue=6 |pages=663–70}}
   −
* [[Melvin Dresher|Dresher, M.]] (1961). ''The Mathematics of Games of Strategy: Theory and Applications''  [[Prentice-Hall]], Englewood Cliffs, NJ.
+
* Melvin Dresher (1961). ''The Mathematics of Games of Strategy: Theory and Applications''  Prentice-Hall, Englewood Cliffs, NJ.
   −
* Greif, A. (2006). ''Institutions and the Path to the Modern Economy: Lessons from Medieval Trade.'' Cambridge University Press, [[Cambridge]], UK.
+
* Greif, A. (2006). ''Institutions and the Path to the Modern Economy: Lessons from Medieval Trade.'' Cambridge University Press, Cambridge, UK.
   −
* [[Anatol Rapoport|Rapoport, Anatol]] and Albert M. Chammah (1965). ''Prisoner's Dilemma''. [[University of Michigan Press]].
+
* Anatol Rapoport and Albert M. Chammah (1965). ''Prisoner's Dilemma''. University of Michigan Press.
    
{{refend}}
 
{{refend}}
第530行: 第436行:       −
==External links==
+
==外部链接==
外部链接
  −
*{{Commonscat-inline}}
      
* [http://plato.stanford.edu/entries/prisoner-dilemma/ Prisoner's Dilemma (''Stanford Encyclopedia of Philosophy'')]
 
* [http://plato.stanford.edu/entries/prisoner-dilemma/ Prisoner's Dilemma (''Stanford Encyclopedia of Philosophy'')]
第556行: 第460行:  
* [http://iterated-prisoners-dilemma.info Iterated Prisoner's Dilemma online game] by Wayne Davis
 
* [http://iterated-prisoners-dilemma.info Iterated Prisoner's Dilemma online game] by Wayne Davis
   −
{{Decision theory paradoxes}}
  −
  −
{{Game theory}}
  −
  −
  −
  −
{{Authority control}}
  −
  −
  −
  −
[[Category:Non-cooperative games]]
  −
  −
Category:Non-cooperative games
  −
  −
类别: 非合作性游戏
  −
  −
[[Category:Thought experiments]]
  −
  −
Category:Thought experiments
  −
  −
类别: 思维实验
  −
  −
[[Category:Dilemmas]]
  −
  −
Category:Dilemmas
  −
  −
类别: 困境
  −
  −
[[Category:Environmental studies]]
  −
  −
Category:Environmental studies
  −
  −
类别: 环境研究
  −
  −
[[Category:Social psychology]]
  −
  −
Category:Social psychology
  −
  −
类别: 社会心理学
  −
  −
[[Category:Moral psychology]]
     −
Category:Moral psychology
     −
范畴: 道德心理学
+
----
 +
本中文词条由Henry翻译,Smile审校,[[用户:薄荷|薄荷]]编辑,如有问题,欢迎在讨论页面留言。
   −
<noinclude>
+
'''本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。'''
   −
<small>This page was moved from [[wikipedia:en:Prisoner's dilemma]]. Its edit history can be viewed at [[囚徒困境/edithistory]]</small></noinclude>
     −
[[Category:待整理页面]]
+
[[Category:非合作性游戏]]
 +
[[Category:思维实验]]
 +
[[Category:困境]]
 +
[[Category:环境研究]]
 +
[[Category:社会心理学]]
 +
[[Category:道德心理学]]
7,129

个编辑

导航菜单