更改

添加233字节 、 2020年9月26日 (六) 16:18
第487行: 第487行:  
动态规划和最优化控制可以解决大型的多阶段决策问题,在计算资源有限的情况下,如何获得获得近似解,并且要求找到的近似解达到一定的性能需求。这类方法通常被统称为强化学习,有时也会被叫做近似动态规划或神经动态规划。从最优控制的角度解读强化学习,探索其中的内在联系。
 
动态规划和最优化控制可以解决大型的多阶段决策问题,在计算资源有限的情况下,如何获得获得近似解,并且要求找到的近似解达到一定的性能需求。这类方法通常被统称为强化学习,有时也会被叫做近似动态规划或神经动态规划。从最优控制的角度解读强化学习,探索其中的内在联系。
    +
----
 +
本中文词条由[[NeverMoes|NeverMoes]]翻译编辑,[[用户:打豆豆|打豆豆]]、[[用户:薄荷|薄荷]]编辑,欢迎在讨论页面留言。
 +
 +
'''本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。'''
    
{{DEFAULTSORT:控制理论}}
 
{{DEFAULTSORT:控制理论}}
421

个编辑