第4行: |
第4行: |
| | | |
| [[File:博弈论.jpeg|500px|thumb|upright=3|博弈论:研究具有斗争或竞争性质现象的理论和方法|right]] | | [[File:博弈论.jpeg|500px|thumb|upright=3|博弈论:研究具有斗争或竞争性质现象的理论和方法|right]] |
− | '''博弈论 Game theory'''( 亦称对策论或赛局理论) 是研究理性决策者之间战略互动的'''数学模型 Mathematical models''' ,<ref name=Myerson>[[Roger B. Myerson|Myerson, Roger B.]] (1991). ''Game Theory: Analysis of Conflict,'' Harvard University Press, p. [https://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PA1 1]. Chapter-preview links, pp. [https://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PR7 vii–xi].</ref>是研究具有斗争或竞争性质现象的理论和方法。博弈论既是现代数学的一个新分支,也是运筹学的一个重要学科,在'''社会科学 Social science''' 、'''逻辑学 Logic'''、'''系统科学 Systems science'''和'''计算机科学 Computer science''' 中也有应用。 博弈论最初产生于'''零和游戏 Zero-sum game'''(也称零和博弈),在这种游戏中,赢家的利润来自于输家的亏损,每个参与者的收益或损失由其他参与者的损失或收益来平衡,各方损益总和永远为“零”。 今天,博弈论适用于广泛的行为关系,已成为人类、动物和计算机逻辑决策科学的总称。 | + | '''博弈论 Game theory'''( 亦称对策论或赛局理论) 是研究理性决策者之间战略互动的'''数学模型 Mathematical models''' ,<ref name=Myerson>Roger B. Myerson (1991). ''Game Theory: Analysis of Conflict,'' Harvard University Press, p. [https://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PA1 1]. Chapter-preview links, pp. [https://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PR7 vii–xi].</ref>是研究具有斗争或竞争性质现象的理论和方法。博弈论既是现代数学的一个新分支,也是运筹学的一个重要学科,在'''社会科学 Social science''' 、'''逻辑学 Logic'''、'''系统科学 Systems science'''和'''计算机科学 Computer science''' 中也有应用。 博弈论最初产生于'''零和游戏 Zero-sum game'''(也称零和博弈),在这种游戏中,赢家的利润来自于输家的亏损,每个参与者的收益或损失由其他参与者的损失或收益来平衡,各方损益总和永远为“零”。 今天,博弈论适用于广泛的行为关系,已成为人类、动物和计算机逻辑决策科学的总称。 |
| | | |
| | | |
第16行: |
第16行: |
| [[File:JohnvonNeumann-LosAlamos.gif|500px|thumb|upright=3|John von Neumann |right]] | | [[File:JohnvonNeumann-LosAlamos.gif|500px|thumb|upright=3|John von Neumann |right]] |
| [[File:John_f_nash_20061102_3.jpg|500px|thumb|upright=3|John nash|right]] | | [[File:John_f_nash_20061102_3.jpg|500px|thumb|upright=3|John nash|right]] |
− | 早在现代数学博弈论兴起之前,关于二人博弈的讨论就开始了。 已知的对于博弈论的第一次讨论,源于一封1973年被认为是活跃的雅各宾派成员查尔斯•瓦德格拉夫 Charles Waldegrave 写的信。他是英国外交官詹姆斯•瓦德格拉夫 James Waldegrave 的叔叔。鉴于现有的细节和证据有限且对原作者的介绍较为模糊,原作者的真实身份尚难确认。 | + | 早在现代数学博弈论兴起之前,关于二人博弈的讨论就开始了。 已知的对于博弈论的第一次讨论,源于一封1973年被认为是活跃的雅各宾派成员查尔斯•瓦德格拉夫 Charles Waldegrave 写的信。他是英国外交官詹姆斯•瓦德格拉夫 James Waldegrave 的叔叔。<ref name="GT-PD-01">{{citation |url=http://www.jehps.net/Decembre2007/Bellhouse.pdf |title=The Problem of Waldegrave |author=Bellhouse, David R. |journal=Journal Électronique d'Histoire des Probabilités et de la Statistique |trans-work=Electronic Journal of Probability History and Statistics |year=2007 |volume=3 |issue=2}}</ref> 鉴于现有的细节和证据有限且对原作者的介绍较为模糊,原作者的真实身份尚难确认。 |
| | | |
| | | |
− | 有一种理论认为 James Waldegrave 才是真正的作者,但这还有待证实。在这封信中, James Waldegrave 为法国的一种纸牌游戏 '''le Her'''提供了一个极小极大的混合策略解决方案,这个方案现在被称为'''瓦德格拉夫问题 Waldegrave problem''' 。1838年,安东尼·奥古斯汀·库尔诺 Antoine Augustin Cournot 在'''《财富理论的数学原理 Principes de la Théorie des Richesses 》''' 一书中考虑了双寡头垄断,并提出了一个解决方案,即博弈论中的'''纳什平衡 Nash equilibrium''' 。 | + | 有一种理论认为 James Waldegrave 才是真正的作者,但这还有待证实。<ref>{{cite journal |last1=Bellhouse |first1=David R. |title=Le Her and Other Problems in Probability Discussed by Bernoulli, Montmort and Waldegrave |journal=Statistical Science |volume=30 |pages=26–39 |date=2015 |publisher=[[Institute of Mathematical Statistics]] |issue=1 |arxiv=1504.01950 |doi=10.1214/14-STS469 |bibcode=2015arXiv150401950B }}</ref>在这封信中, James Waldegrave 为法国的一种纸牌游戏 '''le Her'''提供了一个极小极大的混合策略解决方案,这个方案现在被称为'''瓦德格拉夫问题 Waldegrave problem''' 。1838年,安东尼·奥古斯汀·库尔诺 Antoine Augustin Cournot 在'''《财富理论的数学原理 Principes de la Théorie des Richesses 》''' 一书中考虑了双寡头垄断,并提出了一个解决方案,即博弈论中的'''纳什平衡 Nash equilibrium''' 。 |
| | | |
| | | |
− | 1913年,恩斯特·泽梅罗 Ernst Zermelo 发表了'''《关于集合论在国际象棋博弈理论中的应用 On a Application of Set Theory to the Theory of the Game of the Chess》''' ,证明了最优的国际象棋策略是严格确定的。这为更一般的定理铺平了道路。 | + | 1913年,恩斯特·泽梅罗 Ernst Zermelo 发表了'''《关于集合论在国际象棋博弈理论中的应用 On a Application of Set Theory to the Theory of the Game of the Chess》''' ,证明了最优的国际象棋策略是严格确定的。这为定理的一般化铺平了道路。ref>{{cite conference |url=https://socio.ethz.ch/content/dam/ethz/special-interest/gess/chair-of-sociology-dam/documents/articles/Zermelo_Uber_eine_Anwendung_der_Mengenlehre_auf_die_Theorie_des_Schachspiels.pdf |archiveurl=https://web.archive.org/web/20151023075458/http://www.socio.ethz.ch/content/dam/ethz/special-interest/gess/chair-of-sociology-dam/documents/articles/Zermelo_Uber_eine_Anwendung_der_Mengenlehre_auf_die_Theorie_des_Schachspiels.pdf |archivedate=23 October 2015 |first=Ernst |last=Zermelo |date=1913 |title=Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels |trans-title=On an Application of Set Theory to the Theory of the Game of Chess |language=de |pages=501-504 |author-link=Ernst Zermelo |conference=Proceedings of the Fifth International Congress of Mathematicians (1912) |editor-first1=E. W. |editor-last1=Hobson |editor-first2=A. E. H. |editor-last2=Love |publisher=Cambridge University Press |location=Cambridge |url-status=dead |df=mdy-all |access-date=29 August 2019 }}</ref> |
| | | |
| | | |
− | 1938年,丹麦数学经济学家弗雷德里克·祖恩 Frederik Zeuthen 利用'''布劳威尔不动点定理 Brouwer's fixed point theorem''' ,证明了数学模型具有获胜策略。在波莱尔 Emile Borel 1938年的著作'''《哈萨德的应用 Applications aux Jeux de Hasard》''' 和更早的笔记中,Borel 证明了当收益矩阵是对称时, 二人零和矩阵对策的极大极小定理,并提供了一个非平凡无限对策的解(在英语中称为Blotto博弈)。Borel推测有限二人零和博弈中不存在混合策略均衡,这一猜想被[[约翰·冯·诺依曼 John von Neumann]] 证明是错误的。 | + | 1938年,丹麦数学经济学家弗雷德里克·祖恩 Frederik Zeuthen 利用'''布劳威尔不动点定理 Brouwer's fixed point theorem''' ,<ref>{{cite book |editor-last=Kim |editor-first=Sungwook |title=Game theory applications in network design |page=3 |publisher=IGI Global |year=2014 |url=https://books.google.com/books?id=phOXBQAAQBAJ&pg=PA3|isbn=9781466660519}}</ref>证明了数学模型具有获胜策略。在波莱尔 Emile Borel 1938年的著作'''《哈萨德的应用 Applications aux Jeux de Hasard》''' 和更早的笔记中,Borel 证明了当收益矩阵是对称时, 二人零和矩阵对策的极大极小定理,并提供了一个非平凡无限对策的解(在英语中称为Blotto博弈)。Borel推测有限二人零和博弈中不存在混合策略均衡,这一猜想被[[约翰·冯·诺依曼 John von Neumann]] 证明是错误的。 |
| | | |
| | | |
− | 直到1928年[[约翰·冯·诺依曼 John von Neumann]] 发表了关于战略博弈论的论文,博弈论才真正成为一个独立的研究领域。[[约翰·冯·诺依曼 John von Neumann]]的原始证明采用了布劳威尔关于连续映射到紧凸集的'''布劳威尔不动点定理 Brouwer fixed-point theorem'''。该种方法成为研究博弈论和数理经济学的标准方法。随后,他在1944年与奥斯卡•摩根斯坦 Oskar Morgenstern 合著了'''《博弈论与经济行为 Theory of Games and Economic Behavior》 ''' 一书。这本书的第二版提供了一个不言自明的效用理论,它将丹尼尔·伯努利 Daniel Bernoulli 的旧的效用理论(与金钱相关)转变为一个独立的学科。[[约翰·冯·诺依曼 John von Neumann]]在博弈论方面的工作突出反映在这本1944年出版的书中。这一基础工作包含了寻找二人零和博弈相互一致解的方法。随后的工作主要集中在合作博弈论上,假设个人之间可以遵守关于采用正确策略的协议,去分析个人群体的最优策略。 | + | 直到1928年[[约翰·冯·诺依曼 John von Neumann]] 发表了关于战略博弈论的论文,博弈论才真正成为一个独立的研究领域。<ref>{{cite journal |first=John von |last=Neumann |authorlink=John von Neumann |year=1928 |title=Zur Theorie der Gesellschaftsspiele |journal=[[Mathematische Annalen]] |trans-work=Mathematical Annals |volume=100 |issue=1 |pages=295–320 |doi=10.1007/BF01448847 |trans-title=On the Theory of Games of Strategy |url=https://www.semanticscholar.org/paper/90d88e38b1fc555012394824d7e9a36171fc0d23 |language=de}}</ref><ref>{{cite book |first=John von |last=Neumann |authorlink=John von Neumann |chapter=On the Theory of Games of Strategy |editor1-first=A. W. |editor1-last=Tucker |editor2-first=R. D. |editor2-last=Luce |year=1959 |title=Contributions to the Theory of Games |volume=4 |pages=13–42 |chapterurl=https://books.google.com/books?id=9lSVFzsTGWsC&pg=PA13}}</ref> [[约翰·冯·诺依曼 John von Neumann]]的原始证明采用了布劳威尔关于连续映射到紧凸集的'''布劳威尔不动点定理 Brouwer fixed-point theorem'''。该种方法成为研究博弈论和数理经济学的标准方法。随后,他在1944年与奥斯卡•摩根斯坦 Oskar Morgenstern 合著了'''《博弈论与经济行为 Theory of Games and Economic Behavior》 ''' 一书。<ref>{{cite book |first=Philip |last=Mirowski |authorlink=Philip Mirowski |chapter=What Were von Neumann and Morgenstern Trying to Accomplish? |editor-first=E. Roy |editor-last=Weintraub |title=Toward a History of Game Theory |location=Durham |publisher=Duke University Press |year=1992 |isbn=978-0-8223-1253-6 |pages=113–147 |chapterurl=https://books.google.com/books?id=9CHY2Gozh1MC&pg=PA113}}</ref> 这本书的第二版提供了一个不言自明的效用理论,它将丹尼尔·伯努利 Daniel Bernoulli 的旧的效用理论(与金钱相关)转变为一个独立的学科。[[约翰·冯·诺依曼 John von Neumann]]在博弈论方面的工作突出反映在这本1944年出版的书中。这一基础工作包含了寻找二人零和博弈相互一致解的方法。随后的工作主要集中在合作博弈论上,假设个人之间可以遵守关于采用正确策略的协议,去分析个人群体的最优策略。<ref>{{citation |last=Leonard |first=Robert |title=Von Neumann, Morgenstern, and the Creation of Game Theory |location=New York |publisher=Cambridge University Press |year=2010 |isbn=9780521562669 |doi=10.1017/CBO9780511778278}}</ref> |
| | | |
| | | |
第34行: |
第34行: |
| [[File:美丽心灵.jpg|350px|right|thumb|由John Forbes Nash故事翻拍而来的电影《美丽心灵》]] | | [[File:美丽心灵.jpg|350px|right|thumb|由John Forbes Nash故事翻拍而来的电影《美丽心灵》]] |
| | | |
− | 大约在同一时间,小约翰·福布斯·纳什 John Forbes Nash 提出了一种球员策略相互一致性的标准,称为纳什均衡,适用于比[[约翰·冯·诺依曼 John von Neumann]] 和 Morgenstern提出的标准更广泛的博弈。John Forbes Nash 是美国数学家,前马萨诸塞理工学院摩尔荣誉讲师,主要研究博弈论、微分几何学和偏微分方程。晚年成为普林斯顿大学的资深研究数学家。1950年, John Forbes Nash 获得美国普林斯顿大学的博士学位,他在仅仅28页的博士论文中提出了一个重要概念,成为博弈论中一项重要突破。这个概念就是前文提到的“纳什均衡”。它被广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。John Forbes Nash 最重要的数学成就是在微分几何和偏微分方程的领域,特别是黎曼流形等距嵌入到欧氏空间的一系列结果。因为在非线性偏微分方程上的贡献,他与路易·尼伦伯格 Louis nierenberg 共同获得了2015年阿贝尔奖 Abel Prize。著名几何学家米哈伊尔·格罗默夫 Mikhail Gromov 这样评价 John Forbes Nash 的工作:“他有巨大的数学分析能力和几何洞察力……他的几何工作,不论是他的结果、技术、使用的想法,都与任何人原先预期的相反……他在几何学所做的,从我看来,比起他在经济学所做的无可比拟地伟大得多,相差很多个数量级。”在1959年之后,由于出现精神上的症状,他的研究生涯曾经中断,在1959年及1961年两度进入医院疗养,被诊断为思觉失调症。John Forbes Nash 拒绝接受精神药物治疗。在1970年后,症状逐渐好转,因此再度回到学术研究工作。他这段时间的经历,由西尔维娅·娜萨 Sylvia Nasar 写成传记,并翻拍为电影《美丽心灵》,使得他的事迹广为人知。 John Forbes Nash 证明了纳什均衡在'''n'''人有限博弈中的普遍存在性,从而开创了与[[约翰·冯·诺依曼 John von Neumann]]和Morgenstern 框架路线均完全不同的“'''非合作博弈 Non-cooperative Game'''”理论。由此推出非合作博弈都存在一个混合策略的纳什均衡点。 | + | 大约在同一时间,小约翰·福布斯·纳什 John Forbes Nash 提出了一种球员策略相互一致性的标准,称为纳什均衡,适用于比[[约翰·冯·诺依曼 John von Neumann]] 和 Morgenstern提出的标准更广泛的博弈。<ref name=stanfordprisoner>{{cite web |url=http://plato.stanford.edu/entries/prisoner-dilemma/ |title=Prisoner's Dilemma |publisher=Stanford University |date=4 September 1997 |accessdate=3 January 2013 |website=Stanford Encyclopedia of Philosophy |first=Steven |last=Kuhn |author-link=Steven Kuhn |df=mdy-all |editor-first=Edward N. |editor-last=Zalta}}</ref> John Forbes Nash 是美国数学家,前马萨诸塞理工学院摩尔荣誉讲师,主要研究博弈论、微分几何学和偏微分方程。晚年成为普林斯顿大学的资深研究数学家。1950年, John Forbes Nash 获得美国普林斯顿大学的博士学位,他在仅仅28页的博士论文中提出了一个重要概念,成为博弈论中一项重要突破。这个概念就是前文提到的“纳什均衡”。它被广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。John Forbes Nash 最重要的数学成就是在微分几何和偏微分方程的领域,特别是黎曼流形等距嵌入到欧氏空间的一系列结果。因为在非线性偏微分方程上的贡献,他与路易·尼伦伯格 Louis nierenberg 共同获得了2015年阿贝尔奖 Abel Prize。著名几何学家米哈伊尔·格罗默夫 Mikhail Gromov 这样评价 John Forbes Nash 的工作:“他有巨大的数学分析能力和几何洞察力……他的几何工作,不论是他的结果、技术、使用的想法,都与任何人原先预期的相反……他在几何学所做的,从我看来,比起他在经济学所做的无可比拟地伟大得多,相差很多个数量级。”在1959年之后,由于出现精神上的症状,他的研究生涯曾经中断,在1959年及1961年两度进入医院疗养,被诊断为思觉失调症。John Forbes Nash 拒绝接受精神药物治疗。在1970年后,症状逐渐好转,因此再度回到学术研究工作。他这段时间的经历,由西尔维娅·娜萨 Sylvia Nasar 写成传记,并翻拍为电影《美丽心灵》,使得他的事迹广为人知。 John Forbes Nash 证明了纳什均衡在'''n'''人有限博弈中的普遍存在性,从而开创了与[[约翰·冯·诺依曼 John von Neumann]]和Morgenstern 框架路线均完全不同的“'''非合作博弈 Non-cooperative Game'''”理论。由此推出非合作博弈都存在一个混合策略的纳什均衡点。 |
| | | |
| | | |
第41行: |
第41行: |
| 20世纪50年代,博弈论首次应用于哲学和政治学。 | | 20世纪50年代,博弈论首次应用于哲学和政治学。 |
| | | |
− | 1979年,罗伯特•阿克塞尔罗德 Robert Axelrod 试图以玩家身份设置电脑程序,结果在他们之间的锦标赛中,他发现获胜者往往是一个简单的“以牙还牙”程序,在第一步中进行合作,然后在接下来的步骤中,按照对手在上一步中的动作进行自己下一步的动作。这一事实被广泛用来解释进化生物学和社会科学中的合作现象。 | + | 1979年,罗伯特•阿克塞尔罗德 Robert Axelrod 试图以玩家身份设置电脑程序,结果在他们之间的锦标赛中,他发现获胜者往往是一个简单的“以牙还牙”程序,在第一步中进行合作,然后在接下来的步骤中,按照对手在上一步中的动作进行自己下一步的动作。这一事实被广泛用来解释进化生物学和社会科学中的合作现象。<ref>{{cite book |last=Wolfram |first=Stephen |authorlink=Stephen Wolfram |title=A New Kind of Science |publisher=Wolfram Media |year=2002 |page=[https://archive.org/details/newkindofscience00wolf/page/1104 1104] |isbn=978-1-57955-008-0 |url=https://archive.org/details/newkindofscience00wolf |url-access=registration}}</ref> |
| | | |
| | | |