LLM-Explorer: A Large Language Model-Driven Plugin for Enhanced Reinforcement Learning Policy Exploration 本研究解决了现有强化学习策略探索方法在任务特定特征考量上的不足。我们提出的LLM-Explorer利用大型语言模型分析当前学习状态,生成任务特定的探索策略,从而动态调整策略探索过程。实验结果显示,该方法在Atari和MuJoCo基准测试中平均提升表现达37.27%。 本研究提出了LLM-Explorer,利用大型语言模型分析学习状态,生成特定任务的探索策略并动态调整。实验结果显示,该方法在Atari和MuJoCo基准测试中平均提升表现37.27%。 Atari LLM-Explorer MuJoCo model 大型语言模型 探索策略