@zjrwqdy 请提供具体代码和报错位置。
@zyk516 大部分时候是直接共享相同的层,可以参考本文:https://mp.weixin.qq.com/s/jN4kGT9VCF5ySxtvuqysRg 中关于变量重用的说明。
@asawanggaa 我没有定义过这种极其深层的模型,可以参考一下网上是否有 Keras 或者 PyTorch 的实现。如果它们对这些模型的定义也很 “臃肿 “,那大概用 TensorFlow 2 也差不多。
@slyrx 我估计是把这些图片直接跳过了,当然我没测试过,你可以自己验证一下。