小红花·文摘

RLAdapter是一种适配器模型，用于强化学习和大型语言模型之间的联系。在Crafter环境中的实验表明，RLAdapter超过了基线模型，代理展现出了常识行为。