更改

添加1字节 、 2020年4月19日 (日) 18:47
第158行: 第158行:       −
对于某些问题,不同的随机博弈建模方法可能导致不同的解决方案。 例如,马尔可夫决策过程MDPs 和'''最大最小解Minimax solution'''解决方案之间的区别在于后者考虑的是一系列对抗性动作的最坏情况,而不是在给定一个固定概率分布的情况下对这些动作作一个预判。 在不确定性的随机模型不可用的情况下,最大最小解解决方案可能是有利的,但也可能高估极不可能(但代价高昂)发生事件的可能性,如果假设对手可以强行让这样的事件发生,则会极大地影响了战略。ref name="McMahan">{{cite journal |first=Hugh Brendan |last=McMahan |date=2006 |url=https://www.cs.cmu.edu/~mcmahan/research/mcmahan_thesis.pdf |title=Robust Planning in Domains with Stochastic Outcomes, Adversaries, and Partial Observability |journal=CMU-CS-06-166 |pages=3–4}}</ref> 关于这类模型问题,特别是与预测和限制投资银行业的损失有关的问题,请参阅黑天鹅效应的更多讨论。
+
对于某些问题,不同的随机博弈建模方法可能导致不同的解决方案。 例如,马尔可夫决策过程MDPs 和'''最大最小解Minimax solution'''解决方案之间的区别在于后者考虑的是一系列对抗性动作的最坏情况,而不是在给定一个固定概率分布的情况下对这些动作作一个预判。 在不确定性的随机模型不可用的情况下,最大最小解解决方案可能是有利的,但也可能高估极不可能(但代价高昂)发生事件的可能性,如果假设对手可以强行让这样的事件发生,则会极大地影响了战略。<ref name="McMahan">{{cite journal |first=Hugh Brendan |last=McMahan |date=2006 |url=https://www.cs.cmu.edu/~mcmahan/research/mcmahan_thesis.pdf |title=Robust Planning in Domains with Stochastic Outcomes, Adversaries, and Partial Observability |journal=CMU-CS-06-166 |pages=3–4}}</ref> 关于这类模型问题,特别是与预测和限制投资银行业的损失有关的问题,请参阅黑天鹅效应的更多讨论。
     
1,526

个编辑