更改

第491行: 第491行:  
====[https://campus.swarma.org/course/1921 赵博:强化学习与最优控制系统]====
 
====[https://campus.swarma.org/course/1921 赵博:强化学习与最优控制系统]====
 
动态规划和最优化控制可以解决大型的多阶段决策问题,在计算资源有限的情况下,如何获得获得近似解,并且要求找到的近似解达到一定的性能需求。这类方法通常被统称为强化学习,有时也会被叫做近似动态规划或神经动态规划。从最优控制的角度解读强化学习,探索其中的内在联系。
 
动态规划和最优化控制可以解决大型的多阶段决策问题,在计算资源有限的情况下,如何获得获得近似解,并且要求找到的近似解达到一定的性能需求。这类方法通常被统称为强化学习,有时也会被叫做近似动态规划或神经动态规划。从最优控制的角度解读强化学习,探索其中的内在联系。
 +
 +
    
----
 
----
7,129

个编辑