“强化学习”的版本历史

查看该页面的日志

跳到导航跳到搜索

差异选择：选中要对比的版本的单选按钮，按Enter键或下方的按钮。
说明：（当前）=与最后版本之间的差异，（之前）=与上一版本之间的差异，小=小编辑。

当前之前 2024年2月21日 (三) 23:25‎ 唐糖糖讨论贡献‎ 79,352字节 -3,477‎
当前之前 2020年11月22日 (日) 00:50‎ Qige96 讨论贡献‎ 82,829字节 +399‎
当前之前 2020年11月22日 (日) 00:48‎ Qige96 讨论贡献‎ 82,430字节 -125‎ →‎理论
当前之前 2020年11月22日 (日) 00:45‎ Qige96 讨论贡献‎ 82,555字节 +1‎ →‎时序差分方法
当前之前 2020年11月22日 (日) 00:44‎ Qige96 讨论贡献‎ 82,554字节 +704‎ →‎时序差分方法
当前之前 2020年11月22日 (日) 00:43‎ Qige96 讨论贡献‎ 81,850字节 -1,381‎ →‎价值函数
当前之前 2020年11月21日 (六) 16:02‎ Qige96 讨论贡献‎ 83,231字节 -716‎ →‎Direct policy search
当前之前 2020年11月21日 (六) 15:38‎ Qige96 讨论贡献‎ 83,947字节 -2,308‎ →‎Further reading
当前之前 2020年11月21日 (六) 15:36‎ Qige96 讨论贡献‎ 86,255字节 -180‎ →‎External links
当前之前 2020年11月21日 (六) 13:26‎ Qige96 讨论贡献‎ 86,435字节 -15‎ →‎强化学习算法比较
当前之前 2020年11月21日 (六) 13:23‎ Qige96 讨论贡献‎ 86,450字节 -624‎ →‎Comparison of reinforcement learning algorithms
当前之前 2020年11月21日 (六) 12:30‎ Qige96 讨论贡献‎ 87,074字节 +888‎ →‎Research
当前之前 2020年11月21日 (六) 00:08‎ Qige96 讨论贡献‎ 86,186字节 +127‎ →‎理论
当前之前 2020年11月21日 (六) 00:06‎ Qige96 讨论贡献‎ 86,059字节 +363‎ →‎Theory
当前之前 2020年11月20日 (五) 23:57‎ Qige96 讨论贡献‎ 85,696字节 +10‎ →‎最佳化准则
当前之前 2020年11月20日 (五) 23:48‎ Qige96 讨论贡献‎ 85,686字节 +81‎ →‎价值函数
当前之前 2020年11月20日 (五) 20:33‎ Qige96 讨论贡献‎ 85,605字节 -94‎ →‎价值函数
当前之前 2020年11月20日 (五) 17:26‎ Qige96 讨论贡献‎ 85,699字节 -262‎ →‎Algorithms for control learning
当前之前 2020年11月20日 (五) 17:04‎ Qige96 讨论贡献‎ 85,961字节 +283‎ →‎探索
当前之前 2020年11月18日 (三) 23:26‎ Qige96 讨论贡献‎ 85,678字节 +1,374‎
当前之前 2020年11月13日 (五) 23:23‎ Qige96 讨论贡献‎ 小 84,304字节 0‎ Qige96移动页面增强学习至强化学习：我们业内现在比较多管这个叫“强化学习”
当前之前 2020年10月11日 (日) 20:33‎ Henry 讨论贡献‎ 84,304字节 +283‎
当前之前 2020年10月9日 (五) 20:09‎ Henry 讨论贡献‎ 84,021字节 +885‎
当前之前 2020年10月9日 (五) 19:43‎ Henry 讨论贡献‎ 83,136字节 +210‎
当前之前 2020年10月9日 (五) 19:15‎ Henry 讨论贡献‎ 82,926字节 +78‎
当前之前 2020年10月7日 (三) 20:41‎ Henry 讨论贡献‎ 82,848字节 -389‎
当前之前 2020年10月7日 (三) 20:30‎ Henry 讨论贡献‎ 83,237字节 +10‎
当前之前 2020年10月6日 (二) 22:57‎ Henry 讨论贡献‎ 83,227字节 +21‎
当前之前 2020年10月5日 (一) 22:54‎ Henry 讨论贡献‎ 83,206字节 -25‎
当前之前 2020年10月5日 (一) 19:40‎ Henry 讨论贡献‎ 83,231字节 +268‎
当前之前 2020年10月5日 (一) 19:22‎ Henry 讨论贡献‎ 82,963字节 +240‎
当前之前 2020年10月4日 (日) 22:35‎ Henry 讨论贡献‎ 82,723字节 -110‎
当前之前 2020年9月27日 (日) 16:16‎ Chancychen 讨论贡献‎ 82,833字节 -9‎
当前之前 2020年9月27日 (日) 16:11‎ Chancychen 讨论贡献‎ 82,842字节 +29‎
当前之前 2020年5月12日 (二) 17:16‎ Moonscar 讨论贡献‎ 82,813字节 +82,813‎ Moved page from wikipedia:en:Reinforcement learning (history)

取自“https://wiki.swarma.org/index.php/强化学习”