如何实现自己导入到数组的数据有 next_batch 功能?

目前我可以使用 np 或者 pd 来把自己 csv 的数据导入到数组中,但是怎么实现来获得 batch 的数据呢?这样就可以一个 batch 一个 batch 的训练数据了,类似 mnist.train.next_batch

目前我是用 dataset 来获取一个迭代器来进行数据的输入。


Oreo.,发表于:2018-6-14 09:21:32

自己手写的话直接使用 python 的生成器,即 yield 语法即可。 如果希望封装好的话就用 Tensorflow 的 DataSets API 或者 Keras 的 Generator。用这两个的好处是帮你做了一些并行、运行时加载等优化,当然自己做也不太难。


winter,发表于 2018-6-14 21:58:56

你用 dataset 的 api,就可以了。。tf.dataset,dataset 的 API 很强大的。。比如 mapping,比如 shuffle 等等,,,就死写起来麻烦,需要教程了私聊我哦。


ViolinSolo ,发表于 2018-7-9 23:45:59