小红花·文摘

本研究提出了SkillFlow框架，旨在提高AI代理在复杂任务中的技能获取效率。该框架通过与环境或其他代理的互动，显著提升任务完成速度并降低成本，尤其在高通信成本情况下效果明显。实证结果显示，经过几次迭代，时间和成本提升可达24.8%。

BriefGPT - AI 论文速递 ·

Eureka是一种由LLMs支持的奖励设计算法，利用GPT-4等最先进的LLMs进行奖励代码的进化优化，生成可用于强化学习的复杂技能获取奖励函数。Eureka在多个开源强化学习环境中表现优异，通用性强，可用于人类反馈进行无梯度的上下文学习。

BriefGPT - AI 论文速递 ·