通过在线文本增强和上下文记忆进行故事可视化
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文提出了一种新颖的记忆架构用于双向Transformer,通过在线文本增强生成多个伪描述作为训练过程中的辅助监督,以更好地适应推理中的语言变化。该方法在两个流行的SV基准测试中表现优于现有技术,并具有较少的计算复杂性。
🎯
关键要点
- 本文提出了一种新颖的记忆架构用于双向Transformer。
- 采用在线文本增强生成多个伪描述作为训练过程中的辅助监督。
- 该方法旨在更好地适应推理中的语言变化。
- 在Pororo-SV和Flintstones-SV两个流行的SV基准测试中表现优于现有技术。
- 该方法具有相似或更少的计算复杂性。
➡️