ViCo:利用人类偏好奖励来提升视频评论生成
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一种结合检索和生成方法的模型,使用关注模块检索相关的用户生成数据评论,并与文章一起作为输入,使用具有复制机制的序列到序列模型。实验证明该模型在大规模评论生成数据集上表现稳健,并在BLEU-1得分方面显著优于其他强基线模型。
🎯
关键要点
-
提出了一种结合检索和生成方法的模型。
-
使用关注模块检索相关的用户生成数据评论。
-
将检索到的评论与文章一起作为输入。
-
采用具有复制机制的序列到序列模型。
-
在大规模评论生成数据集上展示了模型的稳健性。
-
模型在BLEU-1得分方面显著优于其他强基线模型,提升约27到30个BLEU-1点。
➡️