通过在线文本增强和上下文记忆进行故事可视化

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一种新颖的记忆架构用于双向Transformer,通过在线文本增强生成多个伪描述作为训练过程中的辅助监督,以更好地适应推理中的语言变化。该方法在两个流行的SV基准测试中表现优于现有技术,并具有较少的计算复杂性。

🎯

关键要点

  • 本文提出了一种新颖的记忆架构用于双向Transformer。
  • 采用在线文本增强生成多个伪描述作为训练过程中的辅助监督。
  • 该方法旨在更好地适应推理中的语言变化。
  • 在Pororo-SV和Flintstones-SV两个流行的SV基准测试中表现优于现有技术。
  • 该方法具有相似或更少的计算复杂性。
➡️

继续阅读