问一个非常邪乎且有挑战性的问题,有可能使你的模型提升n个点

tensorflow 自带了featurecolumns 这个api tf.featura_columns 我使用这个api在结构化数据里面预测回归问题时,有了巨大的提升。如果去掉,则严重掉精度,到了无法拟合的程度。主要是分桶(当然还参杂了其他操作) 但是这个api实现巨麻烦,而且keras 只能通过dataset 实现,这个对于需要灵活数据输入的我来说是个巨大的困难。 而用pandas 分桶反而达不到相应的效果,因此想问:这个邪乎的api到底是如何实现巨大提升的? 是通过二维分桶(按照官方的说法是[[0,1],[1,2]]这样的形式实现分桶,相比pandas 0,1 这样的分桶多了一个维度)还是说因为输入的时候特征咧分作n个输入而实现提升的呢? (打印keras的时候,发现使用特征列是分作n个输入的dict喂给Input 层的)有无大佬知道的指点一二。模型是deepwide

1 Like