小红花·文摘 - 小红花技术领袖俱乐部

本研究提出GraphEQA方法，旨在解决体感问答中代理在新环境下回答定位问题的挑战，通过利用3D度量-语义场景图和任务相关图像，提升视觉-语言模型的性能。

GraphEQA: Real-time Gesture-based Question Answering Using 3D Semantic Scene Graphs

BriefGPT - AI 论文速递 ·