BriefGPT - AI 论文速递 ·

MORTAR: 基于模型的运行时行为修复框架用于智能化的物理系统

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文介绍了对抗弹性学习（ARL）及其在复杂环境中的应用，强调攻击者与防御者的相互训练。研究了深度强化学习在恶意攻击下的脆弱性，并提出通过对抗训练提升系统稳定性。此外，介绍了RepairAgent，这是首个基于大型语言模型的自主程序修复代理，成功修复了多项错误，为未来软件工程提供了新思路。

🎯

❓

对抗弹性学习（ARL）是一种定义攻击者和防御者两个代理的学习方法，二者在没有领域知识的情况下互相训练，以提高系统的稳定性和鲁棒性。

RepairAgent是首个基于大型语言模型的自主程序修复代理，能够自主规划和执行修复操作，成功修复了164个错误。

深度强化学习在恶意攻击下存在脆弱性，这可能导致决策和控制任务的失败，因此需要通过对抗训练来提高其抗干扰性。

RepairAgent通过收集错误信息、获取修复材料和验证修复结果，自主规划和执行修复操作。

通过对抗训练和因果诊断方法，可以提高赛博物理系统中的运行时属性的稳定性，修复学习控制器的行为问题。

RepairAgent是首次提出基于大型语言模型的自主代理程序修复技术，为未来软件工程的代理技术提供了新思路。

🏷️