大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

量子位 量子位 ·

纽约大学团队在论文中提出类人视觉搜索,赋予大模型360度视觉能力,能够在真实环境中主动搜索目标。研究构建了新基准H*Bench,以评估智能体在复杂场景中的表现,推动视觉空间推理向具身主动范式转型。

原文中文,约3400字,阅读约需8分钟。
阅读原文