小红花·文摘

本研究提出了SafeVLA算法，旨在解决视觉语言行动模型的安全挑战。该算法通过大型约束学习，在模拟环境中有效平衡安全性与任务性能，显著减少危险行为，并在安全性和任务表现上优于现有方法。此方法能够在多样化未知场景中推广学习到的安全约束，降低长尾风险。

SafeVLA: Achieving Safety Alignment of Vision-Language-Action Models via Safe Reinforcement Learning

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）与视觉-语言模型（VLM）在机器人操作中的应用，提出了视觉语言行动模型（VLA），通过自然语言与机器人动作的结合，提升了机器人在复杂任务中的表现。研究表明，LLMs具备理解低级控制能力，并能有效进行轨迹规划。OpenVLA模型在多样化数据集上表现优异，展示了其在新环境中的强泛化能力和计算效率，为机器人技能教学提供了新方法。

LADEV：面向机器人操作的视觉语言行动模型的语言驱动测试与评估平台

BriefGPT - AI 论文速递 ·

该文介绍了一种名为视觉语言行动模型（VLA）的机器人控制模型，通过在互联网规模的数据上训练视觉语言模型，将其直接融入端到端的机器人控制中，提高泛化能力和实现新兴的语义推理。该模型可以对新对象进行泛化，解释不在机器人训练数据中的命令，并对用户指令做出初步推理。同时，该模型还可以进行多阶段的语义推理。

RT - 轨迹：通过事后轨迹草图实现机器人任务的泛化

BriefGPT - AI 论文速递 ·