请问如果不使用 model.compile () 和 model.fit () 而是手动进行模型训练(实现 tf.keras.model,使用 apply_gradients)该如何使用分布式训练方式?