第152行: |
第152行: |
| ===随机博弈(以及与其他领域的关系)=== | | ===随机博弈(以及与其他领域的关系)=== |
| | | |
− | 具有随机博弈的个人决策问题有时被认为是“单人博弈”。 有些作者并不认为这些情况是博弈论讨论的范畴。 它们可以在决策理论、运筹学和人工智能领域的相关学科中使用类似的工具进行建模,尤其是人工智能规划(具有不确定性)和多智能体系统。 虽然这些领域可能有不同的激发因素,但所涉及的数学基本上是相同的,例如使用'''马尔可夫决策过程 Markov decision processes''' 。 | + | 具有随机博弈的个人决策问题有时被认为是“单人博弈”。 有些作者并不认为这些情况是博弈论讨论的范畴。 它们可以在决策理论、运筹学和人工智能领域的相关学科中使用类似的工具进行建模,尤其是人工智能规划(具有不确定性)和多智能体系统。 虽然这些领域可能有不同的激发因素,但所涉及的数学基本上是相同的,例如使用'''马尔可夫决策过程 Markov decision processes'''(MDPs) 。 |
| | | |
| | | |
第158行: |
第158行: |
| | | |
| | | |
− | 对于某些问题,不同的随机博弈建模方法可能导致不同的解决方案。 例如,马尔可夫决策过程MDPs 和'''最大最小解解决方案 Minimax solution''' 之间的区别在于后者考虑的是一系列对抗性动作的最坏情况,而不是在给定一个固定概率分布的情况下对这些动作作一个预判。 在不确定性的随机模型不可用的情况下,最大最小解解决方案可能是有利的,但也可能高估极不可能(但代价高昂)发生事件的可能性,如果假设对手可以强行让这样的事件发生,则会极大地影响了战略。 关于这类模型问题,特别是与预测和限制投资银行业的损失有关的问题,请参阅黑天鹅效应的更多讨论。 | + | 对于某些问题,不同的随机博弈建模方法可能导致不同的解决方案。 例如,马尔可夫决策过程MDPs 和'''最大最小解Minimax solution'''解决方案之间的区别在于后者考虑的是一系列对抗性动作的最坏情况,而不是在给定一个固定概率分布的情况下对这些动作作一个预判。 在不确定性的随机模型不可用的情况下,最大最小解解决方案可能是有利的,但也可能高估极不可能(但代价高昂)发生事件的可能性,如果假设对手可以强行让这样的事件发生,则会极大地影响了战略。 关于这类模型问题,特别是与预测和限制投资银行业的损失有关的问题,请参阅黑天鹅效应的更多讨论。 |
| | | |
| | | |
− | 一般模型也研究了随机博弈的所有元素、对手、和局部或噪声可观察性(其他参与者的行动)。 “金标准”被认为是部分可观测的随机对策(POSG) ,但在 POSG 表示中很少有现实问题在计算上可行。 | + | 一般模型也研究了随机博弈的所有元素、对手、和局部或噪声可观察性(其他参与者的行动)。 “'''金标准'''”被认为是部分可观测的随机对策 Partial Observable Stochastic Game(POSG) ,但很少有在 POSG 表示中的现实问题在计算上可行。 |
| | | |
| ===元游戏=== | | ===元游戏=== |