小红花·文摘 - 小红花技术领袖俱乐部

$WALL-OSS——点燃QwenVL 2.5在具身空间中的潜力：VL FFN可预测子任务及离散动作token，Action FNN则预测连续动作$

WALL-OSS——点燃QwenVL 2.5在具身空间中的潜力：VL FFN可预测子任务及离散动作token，Action FNN则预测连续动作

结构之法算法之道 ·

本文探讨了通过知识隔离和联合训练提升视觉-语言-动作模型（VLA）性能的方法。研究表明，传统训练方法导致知识损失和推理速度慢。作者提出的知识隔离技术有效保护预训练模型知识，同时使模型适应机器人控制任务，从而加快训练和推理速度。

π0.5的KI改进版——知识隔离：让VLM在不受动作专家负反馈的同时，输出离散动作token，并根据反馈做微调(而非冻结VLM)

结构之法算法之道 ·