ViCo:利用人类偏好奖励来提升视频评论生成
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一种结合检索和生成方法的模型,使用关注模块检索相关的用户生成数据评论,并与文章一起作为输入,使用具有复制机制的序列到序列模型。实验证明该模型在大规模评论生成数据集上表现稳健,并在BLEU-1得分方面显著优于其他强基线模型。
🎯
关键要点
- 提出了一种结合检索和生成方法的模型。
- 使用关注模块检索相关的用户生成数据评论。
- 将检索到的评论与文章一起作为输入。
- 采用具有复制机制的序列到序列模型。
- 在大规模评论生成数据集上展示了模型的稳健性。
- 模型在BLEU-1得分方面显著优于其他强基线模型,提升约27到30个BLEU-1点。
➡️