小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

浙江大学等团队提出了ViewSpatial-Bench基准,用于评估视觉语言模型的空间推理能力。该基准包含5700个问答对,涵盖多视角任务,显示当前模型在空间理解方面的不足。研究开发的MVSM模型在性能上显著提升,推动AI系统向类人空间认知能力发展。

5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文

量子位
量子位 · 2025-06-02T04:41:06Z

本研究探讨了视觉语言模型在简单空间认知中的不足,开发了名为TableTest的基准数据集进行测试。结果表明,逻辑描述的微小变化显著影响模型表现,揭示了其在推理空间关系方面的局限性。

Vision Language Models Are Unreliable in Simple Spatial Cognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究探讨大型语言模型(LLM)在导航和城市规划等领域的空间智能应用,分析人类空间认知与推理的关系,提出从空间记忆到推理的整体框架,促进跨学科研究。

Cross-Scale Research on Spatial Intelligence Based on Large Language Models: Advances in Embodied Intelligence, Smart Cities, and Earth Sciences

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

群核科技在GTC2025大会上开源了空间理解模型SpatialLM,旨在提升机器的空间认知能力。该模型基于大语言模型,能够从视频生成3D场景布局,支持自然语言描述和场景交互。SpatialLM为具身智能领域提供基础训练框架,降低训练门槛,并与空间智能平台SpatialVerse协同,推动数字仿真与物理现实的结合。

1段视频=亿万虚拟场景!群核开源空间理解多模态模型,真实世界秒变机器人训练场

量子位
量子位 · 2025-03-19T06:59:54Z
1段视频=亿万虚拟场景,当真实世界秒变机器人训练场

群核科技在GTC2025大会上开源了空间理解模型SpatialLM,突破了传统大语言模型的局限,赋予机器空间认知能力。该模型能够通过视频生成3D场景布局,支持企业微调,降低训练门槛,并与空间智能平台SpatialVerse协同,推动具身智能机器人发展。

1段视频=亿万虚拟场景,当真实世界秒变机器人训练场

机器之心
机器之心 · 2025-03-19T06:47:04Z
前沿模型中的空间认知是否会出现?

我们提出了SPACE基准,用于评估前沿模型的空间认知能力。该基准基于认知科学研究,考察大规模地图能力、小规模物体形状推理以及空间注意力和记忆等认知基础。结果表明,现代模型在空间智能方面的表现不及动物,且在经典动物认知测试中接近随机水平。

前沿模型中的空间认知是否会出现?

Apple Machine Learning Research
Apple Machine Learning Research · 2025-03-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码