小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

上海人工智能实验室开发的P1系列开源物理推理模型在物理学研究中取得显著进展,特别是在国际奥林匹克物理竞赛中表现突出,P1-235B-A22B模型有望在2025年竞赛中获得金牌。

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z

李飞飞指出,大语言模型在理解物理世界方面存在局限,因其主要依赖一维语言信号,而物理世界是三维的。尽管模型能处理语言任务,但在空间智能和物理推理上表现不佳,无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。

李飞飞一年前究竟说了啥?怎么又火了

量子位
量子位 · 2025-09-11T06:32:39Z
如何教导AI模型进行推理?借助人类

NVIDIA的数据工厂团队正在开发AI模型Cosmos Reason,该模型在Hugging Face的物理推理排行榜上名列第一。通过强化学习,NVIDIA教导模型理解物理世界的限制,使AI系统如机器人能够安全有效地与现实互动。

如何教导AI模型进行推理?借助人类

NVIDIA Blog
NVIDIA Blog · 2025-08-27T23:13:16Z

本研究提出APEX框架,旨在解决大型语言模型(LLMs)在物理交互建模中的局限性。通过物理驱动的任务规划,APEX显著提升了LLMs在现实任务中的表现,强调了物理推理在语言智能与实际任务之间的重要性。

APEX: Providing Real-time Insights for Large Language Models through Physics-Based Task Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

该研究提出了PHYBench,一个评估大型语言模型在物理推理能力的新基准工具。通过设计500个基于现实物理场景的问题,研究发现现有模型在复杂物理推理方面明显不如人类专家,强调了改进模型的必要性。

PHYBench: A Comprehensive Evaluation of Physical Perception and Reasoning in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

英伟达推出的Cosmos-Reason1模型专注于物理常识推理,解决视觉问答中的最佳答案缺失问题。该模型通过多阶段训练显著提升物理推理能力,能够拒绝不明确的选项,适用于自动驾驶等实际场景。

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

机器之心
机器之心 · 2025-03-25T04:38:18Z
将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

何恺明等研究者提出的去噪哈密顿网络(DHN)结合物理约束与神经网络的灵活性,旨在克服物理推理中的局限性。DHN能够捕获非局部时间关系,减轻数值误差,并支持多系统建模。实验结果显示,DHN在轨迹预测、物理参数推断和超分辨率插值等任务中表现优异,推动了物理推理的研究进展。

将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

机器之心
机器之心 · 2025-03-12T06:30:56Z

本研究提出了PhysReason基准,包含1200个物理推理题,发现现有模型在复杂物理推理任务中表现不足,尤其在应用物理定理和理解物理过程方面存在瓶颈。

PhysReason: A Comprehensive Benchmark for Physics-Based Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了“神经力场”(NFF)框架,以解决人工智能在有限经验下的物理推理和泛化问题。NFF通过可解释的力场有效捕捉核心物理概念,展现出优越的泛化能力。

Neural Force Field: Learning Universal Physical Representations from Few Examples

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

CueTip是一种互动式台球助手,解决了现有工具缺乏解释性和物理感知的问题。它结合自然语言界面、上下文物理推理和专家指导,提供新颖的辅导体验。实验表明,CueTip能提高胜率,展现出可靠性和有效性。

CueTip: An Interactive and Explainable Physics-aware Pool Assistant

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究提出两种方法,通过模拟数据增强视觉-语言模型的物理推理能力,包括问答对微调和物理上下文构建器。实验结果表明,这些方法显著提升了模型在物理推理任务中的表现。

合成视觉:训练视觉-语言模型以理解物理学

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出了LLMPhy框架,结合大型语言模型与物理引擎,解决机器人在复杂多体相互作用中的物理推理问题。通过TraySim数据集,显著提升了推理的精确性和效率,实验结果显示其在零-shot物理推理和参数估计方面表现优越。

LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究提出Kinetix框架,通过生成数千万个2D任务并利用Jax2D进行训练,展示了智能体在未见环境中的强大物理推理能力,且在特定任务微调上优于传统强化学习,为在线强化学习的预训练奠定基础。

Kinetix:通过开放式物理控制任务调查通用智能体的训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

研究提出GLIMO模型,通过代理世界模型收集和合成训练数据,提升大型语言模型在物理推理和机器人任务中的性能。实验表明,GLIMO显著提高了开源模型如LLaMA-3的表现,并具备与GPT-4竞争的潜力。研究还探讨了LLMs在机器人领域的应用,提出多模态GPT-4V结合自然语言和视觉感知来增强任务规划,提升机器人表现,并展望了未来LLMs的研究方向。

在不完美的世界模型中将大型语言模型与具身环境结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文总结了基于直觉物理的深度学习方法在物理推理方面的最新进展和技术,分为三个方面的物理推理,并将其组织为三种一般的技术方法,提出了该领域的六个分类任务。同时,本文强调了当前领域的挑战并提出了未来的研究方向。

基于人工智能因果模型的推断物理定律

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码