小红花·文摘 - 小红花技术领袖俱乐部

$T-WAM——用于富接触操作的视觉-触觉世界动作模型：在统一的流匹配框架下联合学习未来视觉预测、触觉形变预测以及动作预测(且在插入透明导管场景中增大触觉的权重)$

T-WAM——用于富接触操作的视觉-触觉世界动作模型：在统一的流匹配框架下联合学习未来视觉预测、触觉形变预测以及动作预测(且在插入透明导管场景中增大触觉的权重)

结构之法算法之道 ·

机器人的终局：英伟达 Jim Fan 宣告 VLA 时代结束，WAM 登场

机器人的终局：英伟达 Jim Fan 宣告 VLA 时代结束，WAM 登场

宝玉的分享 ·

$Fast-WAM——训练时保留视频联合训练(虽同时生成但动作token不看视频token)，在推理时则移除显式的未来视频生成，直接在单次前向中，依托得到的潜在世界表征KV Cache预测动作$

Fast-WAM——训练时保留视频联合训练(虽同时生成但动作token不看视频token)，在推理时则移除显式的未来视频生成，直接在单次前向中，依托得到的潜在世界表征KV Cache预测动作

结构之法算法之道 ·

交大系的酷哇科技推出COOWA WAM 2.0世界模型，标志着机器人从模仿转向推理，提升物理AI能力。该技术通过反事实推演和直觉行动系统，解决传统机器人在真实世界中的挑战，预计2026年交付超1万台机器人，助力未来城市“Robo City”的建设。

让城市成为一个生命体：交大系酷哇发布WAM 2.0世界模型，剑指RoboCity终局

量子位 ·