小红花·文摘

本文介绍了多种创新的场景图生成方法，包括综合连续场景图生成（CSEGG）、边缘双场景图生成（EdgeSGG）和终身场景图生成（LSGG）。研究表明，这些方法在对象关系预测和长尾问题上取得显著提升，尤其在视觉语言任务中表现优异。此外，空间-时间知识嵌入变压器（STKET）和Text-Image结合模型（TISGG）在生成视频场景图和解决长尾问题方面也展现了优势。