小红花·文摘

本文介绍了对抗弹性学习（ARL）及其在复杂环境中的应用，强调攻击者与防御者的相互训练。研究了深度强化学习在恶意攻击下的脆弱性，并提出通过对抗训练提升系统稳定性。此外，介绍了RepairAgent，这是首个基于大型语言模型的自主程序修复代理，成功修复了多项错误，为未来软件工程提供了新思路。