小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Nano Banana推出了Gemini Omni,结合图像生成与编辑能力,用户可通过自然语言编辑视频,生成高质量内容。Omni支持图像、音频和文本输入,能够创建真实感强的场景,并具备物理推理能力。首个模型Gemini Omni Flash已上线,未来将扩展更多功能。

介绍Gemini Omni

The Keyword
The Keyword · 2026-05-19T17:45:00Z
具身大模型R1时刻:LIBERO终结者,99.9%背后的物理推理新范式

LaST-R1是一种新型机器人强化学习框架,通过隐空间中的物理推理优化机器人的思考和动作。该方法结合LAPO算法,使机器人在执行动作前进行推理,从而提高在复杂环境中的适应能力和成功率。实验结果显示,LaST-R1在仿真和实际任务中均表现优异,成功率显著提升,标志着机器人从“模仿”向“理解”迈进。

具身大模型R1时刻:LIBERO终结者,99.9%背后的物理推理新范式

量子位
量子位 · 2026-05-11T01:51:36Z
AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

上海人工智能实验室开发的P1系列开源物理推理模型在物理学研究中取得显著进展,特别是在国际奥林匹克物理竞赛中表现突出,P1-235B-A22B模型有望在2025年竞赛中获得金牌。

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z

李飞飞指出,大语言模型在理解物理世界方面存在局限,因其主要依赖一维语言信号,而物理世界是三维的。尽管模型能处理语言任务,但在空间智能和物理推理上表现不佳,无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。

李飞飞一年前究竟说了啥?怎么又火了

量子位
量子位 · 2025-09-11T06:32:39Z
如何教导AI模型进行推理?借助人类

NVIDIA的数据工厂团队正在开发AI模型Cosmos Reason,该模型在Hugging Face的物理推理排行榜上名列第一。通过强化学习,NVIDIA教导模型理解物理世界的限制,使AI系统如机器人能够安全有效地与现实互动。

如何教导AI模型进行推理?借助人类

NVIDIA Blog
NVIDIA Blog · 2025-08-27T23:13:16Z

本研究提出APEX框架,旨在解决大型语言模型(LLMs)在物理交互建模中的局限性。通过物理驱动的任务规划,APEX显著提升了LLMs在现实任务中的表现,强调了物理推理在语言智能与实际任务之间的重要性。

APEX: Providing Real-time Insights for Large Language Models through Physics-Based Task Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

该研究提出了PHYBench,一个评估大型语言模型在物理推理能力的新基准工具。通过设计500个基于现实物理场景的问题,研究发现现有模型在复杂物理推理方面明显不如人类专家,强调了改进模型的必要性。

PHYBench: A Comprehensive Evaluation of Physical Perception and Reasoning in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

英伟达推出的Cosmos-Reason1模型专注于物理常识推理,解决视觉问答中的最佳答案缺失问题。该模型通过多阶段训练显著提升物理推理能力,能够拒绝不明确的选项,适用于自动驾驶等实际场景。

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

机器之心
机器之心 · 2025-03-25T04:38:18Z
将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

何恺明等研究者提出的去噪哈密顿网络(DHN)结合物理约束与神经网络的灵活性,旨在克服物理推理中的局限性。DHN能够捕获非局部时间关系,减轻数值误差,并支持多系统建模。实验结果显示,DHN在轨迹预测、物理参数推断和超分辨率插值等任务中表现优异,推动了物理推理的研究进展。

将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

机器之心
机器之心 · 2025-03-12T06:30:56Z

本研究提出了PhysReason基准,包含1200个物理推理题,发现现有模型在复杂物理推理任务中表现不足,尤其在应用物理定理和理解物理过程方面存在瓶颈。

PhysReason: A Comprehensive Benchmark for Physics-Based Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了“神经力场”(NFF)框架,以解决人工智能在有限经验下的物理推理和泛化问题。NFF通过可解释的力场有效捕捉核心物理概念,展现出优越的泛化能力。

Neural Force Field: Learning Universal Physical Representations from Few Examples

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

CueTip是一种互动式台球助手,解决了现有工具缺乏解释性和物理感知的问题。它结合自然语言界面、上下文物理推理和专家指导,提供新颖的辅导体验。实验表明,CueTip能提高胜率,展现出可靠性和有效性。

CueTip: An Interactive and Explainable Physics-aware Pool Assistant

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究提出两种方法,通过模拟数据增强视觉-语言模型的物理推理能力,包括问答对微调和物理上下文构建器。实验结果表明,这些方法显著提升了模型在物理推理任务中的表现。

合成视觉:训练视觉-语言模型以理解物理学

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出了LLMPhy框架,结合大型语言模型与物理引擎,解决机器人在复杂多体相互作用中的物理推理问题。通过TraySim数据集,显著提升了推理的精确性和效率,实验结果显示其在零-shot物理推理和参数估计方面表现优越。

LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究提出Kinetix框架,通过生成数千万个2D任务并利用Jax2D进行训练,展示了智能体在未见环境中的强大物理推理能力,且在特定任务微调上优于传统强化学习,为在线强化学习的预训练奠定基础。

Kinetix:通过开放式物理控制任务调查通用智能体的训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

研究提出GLIMO模型,通过代理世界模型收集和合成训练数据,提升大型语言模型在物理推理和机器人任务中的性能。实验表明,GLIMO显著提高了开源模型如LLaMA-3的表现,并具备与GPT-4竞争的潜力。研究还探讨了LLMs在机器人领域的应用,提出多模态GPT-4V结合自然语言和视觉感知来增强任务规划,提升机器人表现,并展望了未来LLMs的研究方向。

在不完美的世界模型中将大型语言模型与具身环境结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了一种无监督学习物体及其部件关系的物理推理方法,提出了大规模关节物体知识库AKB-48和C-VAM任务,以提升物体理解能力。同时,研究探讨了自然语言模型对物理概念的理解,并提出了SAGE框架,实现关节物体的多样化操作。

通过分析本体模板发现关节物体的概念知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本文研究了大型语言模型(LLMs)在物理和数学推理中的能力,发现其在特定问题上存在局限性。通过增强上下文和使用物理模拟反馈,可以改善模型的推理能力。经过微调的模型在数学推导上表现优于其他模型,但对未知符号敏感。研究还提出了改进逻辑推理能力的策略,并构建了物理问题数据集,验证了LLMs在解决初中物理问题上的有效性,显示其在教育领域的潜力。

通过前提删除干预探索细粒度 LLM 物理推理的极限

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

本文介绍了一种结合对抗性模仿学习和强化学习的系统,用于训练物理模拟角色在复杂场景中的交互。该系统无需手动注释数据,能够处理未见物体和场景。研究提出了I-PHYRE框架,强调代理人的物理推理能力,并介绍了COINS生成模型,实现自然的人-场景互动。此外,构建了PHASE数据集和Physion++基准,以评估多智能体的社会互动和视觉物理预测能力。

PhyScene: 用于实体智能的可供物理交互的 3D 场景合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

本文总结了基于直觉物理的深度学习方法在物理推理方面的最新进展和技术,分为三个方面的物理推理,并将其组织为三种一般的技术方法,提出了该领域的六个分类任务。同时,本文强调了当前领域的挑战并提出了未来的研究方向。

基于人工智能因果模型的推断物理定律

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码