本研究提出了一种名为LLM-Ens的方法,通过大型语言模型增强弱强化学习代理的语义理解,实现动态模型选择。该方法在Atari基准测试中显著提升了强化学习模型的表现,最高提升幅度达20.9%。
完成下面两步后,将自动完成登录并继续当前操作。