本研究提出GraphEQA方法,旨在解决体感问答中代理在新环境下回答定位问题的挑战,通过利用3D度量-语义场景图和任务相关图像,提升视觉-语言模型的性能。
完成下面两步后,将自动完成登录并继续当前操作。