tf.wiki 社区
强化学习简介
技术分享
手册留言
EssalTaol
(EssalTaol)
June 12, 2020, 8:26am
2
数字三角形(变式 1)中的策略评估和策略改进框架中的图里面,策略评估(第 0 轮)左边的红字里面计算向下和向右下的期望的算式是不是写反了。
show post in topic