小红花·文摘

本研究提出了Agent-Arena框架，旨在解决机器人控制算法在新环境中的适应性问题。该框架支持多种控制算法，简化了决策策略的集成与测试，适用于模拟和真实场景。

BriefGPT - AI 论文速递 ·

本研究提出了一种名为MeCo的决策策略，旨在提高大型语言模型（LLMs）在使用外部工具时的自适应能力。通过元认知自我评估，MeCo显著提升了工具使用的决策效率，减少了延迟和错误。

BriefGPT - AI 论文速递 ·

本研究提出了一种新的认知信念驱动Q学习方法，通过主观信念建模提升代理的学习和推理能力，优化决策策略，增强适应性和鲁棒性，优于传统Q学习算法。

BriefGPT - AI 论文速递 ·

本文研究了在差分隐私约束下的最佳臂识别问题，提出了多种算法（如AdaP-TT、Tri-BBAI、Opt-BBAI），并通过实验验证了其样本复杂度和策略有效性，旨在减少误判概率并优化决策策略。

BriefGPT - AI 论文速递 ·