官网说用rtx2系列最多可以提升到三倍速度。我用官网提供的mnist示例看也的确如此。但是我在自己的cnn模型上使用这个功能,结果反而更慢(唯一优势是显存占用大幅降低)。不知道大家尝试的结果是怎么样的?
我刚才把tf官网示例的dnn也添加了cnn,发现提速效果也不明显了。难道这个东西只能搞定dnn吗?
嗯,谢谢!
1 Like
最新发现是maxpooling在混合精度时比float32要慢不少。
1 Like