极道 ·

大模型+机器人：人形运动作为下一个Token预测

💡 原文中文，约800字，阅读约需2分钟。

📝

内容提要

通过27小时行走数据训练全尺寸仿人机器人，在旧金山自由行走。研究将仿人控制视为标记预测问题，通过传感器运动轨迹的自回归预测训练模型。结果表明，模型能在现实世界中泛化，并执行未见过的指令。研究为学习真实世界控制任务提供了前景广阔的道路。

🎯

关键要点

仅使用27小时的行走数据训练全尺寸仿人机器人。
仿人控制视为下一个标记预测问题，类似于语言中的下一个单词预测。
模型通过传感器运动轨迹的自回归预测训练而成。
采用模态对齐的方式进行预测，处理多模态数据。
模型在模拟轨迹上训练，使用多种数据来源。
模型能够让仿人机器人在旧金山随意行走，并能执行未见过的指令。
研究为学习真实世界控制任务提供了前景广阔的道路。

🏷️

继续阅读

RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
史河机器人宣布完成数亿元C轮融资
（全球TMT 2026年07月22日讯）近日，国内智能特种机器人企业史河机器人宣布完成数亿元C轮融资。本轮由强 […]
早报｜iPhone 20 Pro Max或搭载约7英寸屏幕/曝小米上调今年手机出货目标至1.1亿部/Gemini 3.6 Flash发布,输出Token减少17%
· 曝苹果正打样约 7 英寸屏幕，或用于 iPhone 20 Pro Max · 曝小米上调今年手机出货目标至 1.1 亿部 · 张一鸣向芳梅公益基金追加...
从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上） - 张善友
AI 行业过去最喜欢讲的是"能力"，今天越来越必须讲的是"结果"。"有用智能每人民币"（Useful In...
谷歌Gemini 3.6 Flash发布：输出token暴降17%，价格战打到了七块五
谷歌AI模型更新引爆价格战，谁还敢说Flash系列只是“快枪手”？ Google一口气甩出三款新模型，直接把AI价格战打到了每百万token七块五毛钱，这...
我上线了Token共享与交换平台AITokenBus
故事的开始是这样的：有一次，我正在使用AI完成某个任务，突然提示，你的套餐用量已经消耗完了，此时，看着做到一半的任务，我却束手无策。这一刻我的脑海中跳出...

内容提要

关键要点

标签

继续阅读