小红花·文摘

智源大会 | 天工AI重新定义世界模型，公布Matrix-Game 3.5 最新技术突破

量子位 ·

$Galaxea G0.5——升级“VLA自回归建模”范式：摒弃VLM上添加动作专家的模式，而是构建统一模型，用一套权重，在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解)$

Galaxea G0.5——升级“VLA自回归建模”范式：摒弃VLM上添加动作专家的模式，而是构建统一模型，用一套权重，在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解)

结构之法算法之道 ·

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2，且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

结构之法算法之道 ·

蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收，让机器人边推演、边行动

量子位 ·

Realtime-VLA V2——如何让vla运行的更快：从让π0实时抓取下落的钢笔到让 VLA 运行得更快、更平滑且更精确

结构之法算法之道 ·

腕带使佩戴者能够通过自身动作控制机器人手

MIT News - Artificial intelligence ·

DreamZero——同时统一预测未来视觉状态与动作的世界动作模型：解决当下VLA如果人类不示教则理论强但具体操作不强的弊病，且提升任务泛化、本体泛化

结构之法算法之道 ·

$MetaWorld——分层世界模型：融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验，及基于模型RL的对动态环境的在线自适应$

MetaWorld——分层世界模型：融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验，及基于模型RL的对动态环境的在线自适应

结构之法算法之道 ·

蚂蚁灵波开源的LingBot-VA具身世界模型结合视频生成与机器人控制，能够实时推演和执行动作，在复杂任务中表现优异，成功率显著提升，采用新架构实现高效推理，推动具身智能的发展。

让世界模型直接控制机器人动作，蚂蚁灵波开源具身世界模型LingBot-VA

量子位 ·

$Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合：系统1做慢思考且通过价值评估选择对应的动作片段，让系统2持续扩散去噪$

Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合：系统1做慢思考且通过价值评估选择对应的动作片段，让系统2持续扩散去噪

结构之法算法之道 ·

$FPO——流匹配策略梯度：避开复杂的对数似然计算，通过「最大化基于CFM损失计算优势加权比率」做策略优化，兼容PPO-CLIP$

FPO——流匹配策略梯度：避开复杂的对数似然计算，通过「最大化基于CFM损失计算优势加权比率」做策略优化，兼容PPO-CLIP

结构之法算法之道 ·

本文探讨了EmbodiedOneVision模型，该模型通过交错的视觉-文本-动作预训练，实现灵活的多模态推理与动作生成。EO-1采用统一架构，结合离散自回归解码与连续流匹配，提升机器人控制的泛化能力，并强调多模态数据的重要性，提出新的训练方法以优化推理与执行的整合。

EmbodiedOneVision——单个模型中集成离散自回归解码与连续流匹配去噪：Qwen 2.5 VL加两个MLP头完成具身推理、动作生成

结构之法算法之道 ·

本文介绍了多个基于.NET的开发项目，如机器人控制、C#代码执行、PDF处理和JSON Schema支持，强调了技术选型和架构设计的实用性，为开发者提供了宝贵的参考和实践经验。

.NET周刊【7月第4期 2025-07-27】

dotNET跨平台 ·

本文探讨了通过知识隔离和联合训练提升视觉-语言-动作模型（VLA）性能的方法。研究表明，传统训练方法导致知识损失和推理速度慢。作者提出的知识隔离技术有效保护预训练模型知识，同时使模型适应机器人控制任务，从而加快训练和推理速度。

π0.5的KI改进版——知识隔离：让VLM在不受动作专家负反馈的同时，输出离散动作token，并根据反馈做微调(而非冻结VLM)

结构之法算法之道 ·

断网都没用，机器人终于「摆脱」人类控制！Google 首发离线 AI 大脑，一句话让它干活

爱范儿 ·

上海AI实验室推出VeBrain通用智能大脑，集成视觉感知、空间推理和机器人控制，实现机器人像人类一样的“看到-思考-行动”。该模型通过关键点检测和技能识别，提升多模态理解与控制能力，测试结果显示其在多个任务中表现优异。

上海AI实验室造出首个「通才」机器人大脑：看懂世界+空间推理+精准操控全拿下

量子位 ·

Hugging Face 发布 SmolVLA：经济高效的机器人紧凑型 VLA 模型

实时互动网 ·

本文分析了π0模型在机器人控制中的应用，重点介绍了模型的配置、训练、推理及注意力机制优化，并强调了与LeRobot框架的集成及多模态输入处理。

LeRobot pi0——LeRobot对VLA策略π0的封装：含其源码剖析与真机部署(智能化程度高于ACT)

结构之法算法之道 ·

本研究提出了一种基于Adam的扩散策略优化（ADPO）算法，旨在提升扩散模型在强化学习中的优化速度和稳定性。实验结果表明，ADPO在机器人控制任务中表现优异，具有广泛的应用潜力。

自适应扩散策略优化用于机器人操作

BriefGPT - AI 论文速递 ·

本研究提出了一种潜在空间向后规划方案（LBP），显著提升了机器人实时控制的效率与准确性。实验结果表明，LBP在长时间行为任务中优于传统方法，达成了领先性能。

Efficient Robotic Strategy Learning through Potential Space Backward Planning

BriefGPT - AI 论文速递 ·