OpenClaw 2026.4.12更新显著提升了插件加载机制、主动记忆功能和本地AI能力。插件加载改为按需模式,减少资源浪费。主动记忆插件能在用户发言前提取历史信息,改善交互体验。此外,新增本地模型和语音支持,增强隐私和成本效益。更新还优化了执行策略和测试体系,确保AI在复杂环境中稳定运行。
本研究探讨了具身智能体在动态多模态环境中表达信心的方式,提出了信心引导和执行策略,以提升信心校准能力。尽管结构化推理有助于改善校准,但在归纳推理下仍面临不确定性挑战,需要更复杂的引导方法。
研究提出了 Policy-guided Offline RL 算法,能够在训练时将想法分解为指导策略和执行策略,并通过指导策略来指导执行策略以实现状态组合性。该算法在 D4RL 上展示了最高效的性能,并可以通过改变指导策略来适应新的任务。
完成下面两步后,将自动完成登录并继续当前操作。