请问 tensorflow 可以用来实现时序差分学习 td 和动态规划 dp 的问题吗,如果可以的话,应该如何实现
提问人:641663568,发帖时间:2018-5-8 11:23:31
请问 tensorflow 可以用来实现时序差分学习 td 和动态规划 dp 的问题吗,如果可以的话,应该如何实现
提问人:641663568,发帖时间:2018-5-8 11:23:31
这两个机器学习的名次我都没接触过…静静的看着讲解
M 丶 Sulayman,发表于 2018-5-8 17:02:03
不了解。有什么论文可以学习一下这个领域吗?
舟 3332,发表于 2018-5-8 20:54:48
已经有不少在强化学习领域,实现 TD 算法的第三方实现了吧,可以在 GitHub 上搜一搜。
TianLin,发表于 2018-5-20 12:37:57