量子位 ·

“最强具身VLA大模型”，究竟强在哪儿？

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

“最强具身VLA大模型”π*0.6通过Recap学习方法，使机器人从错误中学习，任务成功率超过90%。该模型结合人类示范与自主经验，优化复杂任务表现，展现出高效自我纠正能力，为机器人研究提供新思路。

🎯

❓

任务成功率超过90%。

指导、辅导和练习三个阶段。

通过结合人类示范与自主经验，展现高效自我纠正能力。

通过离线RL训练价值函数和策略，利用多样化的离策略数据。

在高难度任务中，吞吐量提高一倍，失败率降低约2倍。

让机器人能够从错误经验中学习，避免错误累积。

🏷️

国产大模型编码能力实测(GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro)
本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，...
AI sandboxing is having its Kubernetes moment
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...
微软的Xbox模式现已在所有Windows 11 PC上可用
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...
Meta威胁称，如果被迫进行“技术上不可行”的更改，将撤回其在新墨西哥州的应用程序
Meta says it may be forced to pull Facebook, Instagram, and WhatsApp from New...
通过《Saros》，Housemarque主张以不同的方式开发次世代游戏
It is generally frowned upon to care too much about appearances. We have a lo...
马斯克诉奥特曼案中迄今揭示的所有证据
马斯克与奥特曼的诉讼揭示了OpenAI早期的内部邮件和文件。马斯克指控奥特曼等人违反慈善信托，质疑OpenAI是否偏离了其造福全人类的初衷。邮件显示，马斯...