ViCo:利用人类偏好奖励来提升视频评论生成

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该文介绍了一种结合检索和生成方法的模型,使用关注模块检索相关的用户生成数据评论,并与文章一起作为输入,使用具有复制机制的序列到序列模型。实验证明该模型在大规模评论生成数据集上表现稳健,并在BLEU-1得分方面显著优于其他强基线模型。

🎯

关键要点

  • 提出了一种结合检索和生成方法的模型。
  • 使用关注模块检索相关的用户生成数据评论。
  • 将检索到的评论与文章一起作为输入。
  • 采用具有复制机制的序列到序列模型。
  • 在大规模评论生成数据集上展示了模型的稳健性。
  • 模型在BLEU-1得分方面显著优于其他强基线模型,提升约27到30个BLEU-1点。
➡️

继续阅读