Apple Machine Learning Research ·

GRACE：一种可解释的逆强化学习语言模型框架

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

GRACE是一种可解释逆强化学习的语言模型框架，通过专家演示反向工程可解释的奖励函数。该方法结合大型语言模型和进化搜索，生成可执行的代码奖励函数，并在BabyAI和AndroidWorld基准上验证其有效性。GRACE能够在复杂的多任务环境中高效学习准确的奖励，并构建复杂的奖励API。

🎯

🔎

GRACE通过结合大型语言模型与进化搜索，成功反向工程出可解释的奖励函数。这一方法不仅提高了奖励函数的可理解性，还使得生成的代码可以被检查和验证，解决了传统逆强化学习中的“黑箱”问题。

GRACE在复杂的多任务环境中表现出色，能够高效学习准确的奖励。这使得其在实际应用中，尤其是在需要处理多种任务的场景下，具有更强的适应性和灵活性，能够构建复杂的奖励API。

与竞争的模仿学习和在线强化学习方法相比，GRACE生成的奖励函数能够导致更强的策略。这表明GRACE在提升学习效率和策略性能方面具有明显优势，值得关注其在实际应用中的潜力。

❓

GRACE是一种可解释的逆强化学习框架，旨在从专家演示中反向工程可解释的奖励函数。

GRACE结合大型语言模型和进化搜索，生成可执行的代码奖励函数。

GRACE在BabyAI和AndroidWorld基准上进行了实证验证。

GRACE在复杂的多任务环境中表现出色，能够高效学习准确的奖励。

与竞争的模仿学习和在线强化学习方法相比，GRACE生成的奖励能够导致更强的策略。

是的，GRACE能够在多任务设置中构建复杂的奖励API。

🏷️