TF2的混合精度功能怎么样?

官网说用rtx2系列最多可以提升到三倍速度。我用官网提供的mnist示例看也的确如此。但是我在自己的cnn模型上使用这个功能,结果反而更慢(唯一优势是显存占用大幅降低)。不知道大家尝试的结果是怎么样的?

我刚才把tf官网示例的dnn也添加了cnn,发现提速效果也不明显了。难道这个东西只能搞定dnn吗?

不懂啊 问问 @snowkylin

嗯,谢谢!

1 Like

最新发现是maxpooling在混合精度时比float32要慢不少。

1 Like