像图里这种乱跳的可能会是哪些情况呢,虽然迭代次数还比较少,但是没太看出有收敛的迹象,还有精度也是跳来跳去的:
提问人:Future,2018-5-4 23:58:37
感觉可能性有点儿多,楼主如果不方便分享代码,希望至少多上点儿信息吧。比如特征和目标数据的取值范围、优化器、学习率等等。
yunhai_luo,2018-5-5 01:44
尝试一下修改 learn_rate 吧,改小点试试
pjincz,发表于 2018-5-6 21:38:32
你用的是 sgd 吗?lr 多少?
jellycsc,发表于 2018-5-7 00:41:59
学习率太大,也就是步子迈的太大,在最后收敛的时候一直在最低谷周围徘徊。
M 丶 Sulayman ,发表于 2018-5-7 13:02:47
不收敛的话,代码没问题的话,考虑下学习率吧。
ooon ,发表于 2018-5-7 13:46:34
可能的情况:学习率过大
还有一种可能是用验证数据既做验证又做测试;或者验证数据与测试数据存在交叉。
tking,发表于 2018-5-9 20:41:29
要从训练模型,loss 函数等多方面分析的,你这样单一维度谁知道在干什么。
正觉(朔),发表于 2018-5-11 23:11:25
看你的 x 轴 (0–2000),还是刚刚开始训练。
一开始的模型是随机初始化的,loss 看似随机是正常的。观察趋势还是下降的,应该设定更大的训练 steps。观察更长的周期。不用太着急哈!
TianLin,发表于 2018-5-20 12:25:14
winter,发表于 2018-5-25 11:41:33
可能是学习率太大了。
learn_rate 太高导致梯度下降不收敛?
zhanys_7,发表于 2018-7-3 18:32:04
其实可以看出来你的趋势是在收敛的,只不过收敛的会慢一点,如果你考虑增加 epoch ,你就能看出区别了。
但是还是强烈推荐对于图像这种较大的一个 batch 一定要 normalize 或者归一化
ViolinSolo,发表于 2018-7-3 19:54:03