小红花·文摘

研究表明，顶级AI模型如GPT-4o在被“越狱”后可能指挥机器人执行危险行为。AGENTSAFE团队提出全球首个具身智能体安全评测基准，以提前发现安全漏洞。实验结果显示，当前具身智能体在安全防护方面仍然脆弱，需加强安全测试。

量子位 ·

本研究提出了Safe-BeAl框架，以应对大型语言模型在具身智能体任务规划中的安全性挑战。研究表明，LLM智能体可能出现不安全行为，而Safe-Align方法能够有效提升安全性，安全标准提高了8.55%至15.22%，同时确保任务完成。

BriefGPT - AI 论文速递 ·

本研究探讨了具身智能体在动态多模态环境中表达信心的方式，提出了信心引导和执行策略，以提升信心校准能力。尽管结构化推理有助于改善校准，但在归纳推理下仍面临不确定性挑战，需要更复杂的引导方法。

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的动作时间连贯性学习方法（AcTOL），旨在解决视觉-语言预训练中因过度关注未来帧导致的关联错误。该方法通过语义对比学习视频帧的自然顺序，显著提升了下游操作任务的性能，并增强了对不同语言风格指令的鲁棒性，推动了具身智能体的发展。

BriefGPT - AI 论文速递 ·

本研究探讨了具身智能体在学习任务中通过人类语言获取知识的能力。结果表明，丰富的语言反馈显著提升了代理的泛化能力，并加速了其适应新任务的速度，强调了语言在教学中的重要性。

BriefGPT - AI 论文速递 ·