本研究提出了LMAgent,一个基于多模态大语言模型的智能体系统,旨在提高多用户行为模拟的真实性。该系统通过自一致性提示和快速记忆机制增强决策性能,展现出与人类相似的行为,显示出在大规模社交行为模拟中的潜力。
本研究提出了一种新方法CL2DC,旨在在人机协作分类中有效结合学习延迟与补充,以提升决策性能。通过特定预算评估系统表现,结果优于现有方法。
本文介绍了AdaPlanner,一种基于闭环反馈的语言模型智能体,能够自适应改进生成计划,提升复杂任务的决策性能。实验结果表明,其在ALFWorld和MiniWoB++环境中的表现优于现有算法。此外,研究还探讨了大型语言模型在任务分解和计划选择方面的进展与挑战,并提出了结合视觉和语言的导航模型,以增强导航能力和可解释性。
本文探讨了大型语言模型(LLMs)在自动驾驶和机器人领域的应用,结合传统规划与LLMs的推理能力,提升复杂场景下的决策性能。研究表明,LLMs能够理解低级机器人控制,并在视觉导航和异常检测中展现潜力。尽管在某些任务上表现优于传统方法,但仍需克服模型知识局限和计算资源需求等挑战。
本文介绍了一种新方法AdaPlanner,通过闭环反馈改进语言模型的生成计划,提升复杂任务的决策性能。研究表明,该方法在多个环境中优于现有算法,结合经典规划与大型语言模型,提高了计划速度和执行成功率。此外,提出了新的基准数据集和多代理框架,验证了其有效性,推动了自动化软件开发和API集成的发展。
本文介绍了多种基于大型语言模型(LLMs)的规划方法,如 AdaPlanner、SimPlan 和 Meta-Task Planning (MTP)。这些方法结合经典规划技术和新颖的技能发现机制,显著提升了复杂环境中的决策性能。实验结果表明,这些方法在旅行规划和多智能体系统中表现优异,展示了 LLMs 在自动规划中的潜力和应用前景。
本文介绍了一种名为ELLM的方法,利用大型语言模型(LLM)进行强化学习,以优化智能体在对话和任务中的表现。研究表明,LLM能够有效生成交互示例并提升决策性能,尤其在复杂计划任务和机器人任务中取得显著进展。
研究人员通过技能集优化(SSO)方法提出了一种提高大型语言模型在交互环境中决策性能的方法。SSO通过构建和优化可迁移技能,提供给大型语言模型以加强高奖励行为,并通过删除不再产生高奖励的技能来进一步优化技能集。实证评估结果显示,在NetHack和ScienceWorld中,SSO的性能比基准提升了40%和35%。
通过引入空间-时间相关推理等辅助任务,将深度强化学习框架与神经网络结合,提高智能代理在复杂场景中的决策性能和可解释性。
完成下面两步后,将自动完成登录并继续当前操作。