因为 cats_vs_dogs 数据集是用 tf.data 读取的。 tf.data.Dataset 作为一个针对大规模数据设计的迭代器,本身无法方便地获得自身元素的数量,只有迭代一遍之后才知道数据的总量(见 tf.data 一节里 “ Dataset.shuffle () 时缓冲区大小 buffer_size 的设置” 信息框)。数据量太大的时候,数一遍元素个数都是很费时的操作。对模型的训练一般没有什么影响。
因为 cats_vs_dogs 数据集是用 tf.data 读取的。 tf.data.Dataset 作为一个针对大规模数据设计的迭代器,本身无法方便地获得自身元素的数量,只有迭代一遍之后才知道数据的总量(见 tf.data 一节里 “ Dataset.shuffle () 时缓冲区大小 buffer_size 的设置” 信息框)。数据量太大的时候,数一遍元素个数都是很费时的操作。对模型的训练一般没有什么影响。