更改

控制理论 Control theory (查看源代码)

添加233字节、 2020年9月26日 (六) 16:18

第487行：第487行：

动态规划和最优化控制可以解决大型的多阶段决策问题，在计算资源有限的情况下，如何获得获得近似解，并且要求找到的近似解达到一定的性能需求。这类方法通常被统称为强化学习，有时也会被叫做近似动态规划或神经动态规划。从最优控制的角度解读强化学习，探索其中的内在联系。

+

----

+

本中文词条由[[NeverMoes|NeverMoes]]翻译编辑,[[用户:打豆豆|打豆豆]]、[[用户:薄荷|薄荷]]编辑，欢迎在讨论页面留言。

+

'''本词条内容源自wikipedia及公开资料，遵守 CC3.0协议。'''

421

个编辑