小红花·文摘

工具增强型 AI Agents 如何利用推理、记忆和自主性重新定义语言模型

实时互动网 ·

本文提出了一种无奖励强化学习框架，利用Renyi熵解决探索与利用的问题，并设计了相应的算法。研究表明，智能体在缺乏外部奖励时，通过好奇心驱动的内在奖励机制能够有效探索环境。实验结果显示，该方法在多智能体合作和稀疏奖励环境中表现优异，具有广泛的应用潜力。

基于自由能原理的在观测噪声下无害探索的内在回报的模拟研究

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型（LLMs）在机器人规划中的应用，强调自然语言反馈对提升机器人任务执行能力的重要性。研究发现，LLMs能够将自然语言目标转化为结构化计划，但在数字和物理推理任务中表现不佳。提出的交互式规划方法通过机器人收集信息，降低设计成本，并在多智能体合作框架中取得良好效果，为未来研究提供了新思路。

自然语言作为策略：利用 LLMs 进行坐标级体验控制的推理

BriefGPT - AI 论文速递 ·