在上面的推理中,我感觉是噪点影响了神经网络的识别,于是乎我在送入网络之前进行了去噪,二值化操作,训练如下:
train count: 4939, valid count: 2117, test count: 3024,
从图中可以看出,模型收敛了,但有点过拟合。
第 20 回合训练结果:
Epoch 20/20
153/154 [==>.] - ETA: 0s - loss: 0.0407 - accuracy: 0.9861
154/154 [===] - 69s 450ms/step - loss: 0.0408 - accuracy: 0.9860 - val_loss: 0.3227 - val_accuracy: 0.9244
随机选取了 30 张图片进行了测试,8 张错误:
做到这里, 我对之前的推测有了猜疑,是噪点影响的吗?我觉得不是,我做了去燥(有的噪点还在),二值化,使得图片的信息量减少了,神经网络的计算量也大大减少了很多,我能很快看到训练过程中 loss 显著减少,accuracy 也在不断的提高。
整个过程,我用 CPU 进行训练的,电脑配置是 Intel(R)_Core™i7-6700HQ_CPU@_2.60GHz,8G 内存。如果大家的电脑配置高,用 GPU 进行训练,我觉得即使不做预处理,效果肯定也能出来。