关于生成维基百科副标题模型选择的问题

tfers-migration · March 31, 2020, 5:19pm

实验室老板定的课题，就是给定整篇维基百科的文章生成里面副标题，为了简化问题只需要生成第一级的副标题，因为老板给的方向比较坑，基本找不到这方面的论文或模型，所以我现在主要参照的是文本摘要模型，因为现在我看到的的文本摘要模型都是 seq2seq 的，所以我现在正在尝试用 seq2seq+attention 实现，输入整篇文章，输出的是所有副标题连在一起的句子。但是这样的结果并不太好，我想请问各位大佬能不能使 decode 输出一个二维数组，我现在是在谷歌的 textsum 的基础上改模型，看了 decode 的部分感觉无从下手啊。我也想过使用 cnn 或者 rnn 实现，但是文本处理方面基本都是用这些实现文本分类，输出的标签都是 one-hot 的，感觉不是很适合这种文本生成问题。

训练数据的格式是这样的

求各位大佬指条路

JH_L_XY，2018-6-6 12:38:34

tfers-migration · March 31, 2020, 5:20pm

onehot 为什么不适合这类问题？

舟 3332 发表于 2018-6-8 21:25:54

tfers-migration · March 31, 2020, 5:20pm

因为感觉这是个文本生成问题，one-hot 的话更适合做分类吧

JH_L_XY，2018-6-8 21:36

tfers-migration · March 31, 2020, 5:20pm

特意找来 one-hot 的定义：独热编码即 One-Hot 编码，又称一位有效编码，其方法是使用 N 位状态寄存器来对 N 个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候，其中只有一位有效。

neverchange 发表于 2018-7-5 00:32:27

tfers-migration · March 31, 2020, 5:21pm

还是 seq2seq 吧，既然你要文本生成。。就这样吧当作翻译来做

ViolinSolo 发表于 2018-7-6 19:49:48