本文探讨了基于加性关注机制和大型语言模型的场景理解方法,旨在解决场景图生成中的对象关系长尾分布问题。实验结果表明,这些方法在视觉输入、物体重新摆布和人机交互等任务中表现优越,提升了机器人在复杂环境中的操作能力和灵活性。
完成下面两步后,将自动完成登录并继续当前操作。