小红花·文摘

本文提出了一种通用的黑盒认证方法，能够在各种 $l_p$ 范数边界扰动下直接认证平滑策略的累积奖励，并扩展了在动作空间上认证扰动的方法。通过求解凸优化问题确定认证边界，实验证明该方法提高了平均累积奖励的认证下界，且比最先进的技术更高效。

BriefGPT - AI 论文速递 ·

本文提出了一种通用的黑盒认证方法，能够在各种 $l_p$ 范数边界扰动下直接认证平滑策略的累积奖励，并扩展了在动作空间上认证扰动的方法。实验结果表明，该方法提高了平均累积奖励的认证下界，且比最先进的技术更高效。

BriefGPT - AI 论文速递 ·