小红花·文摘

本文讨论了强化学习算法中的隐私保护问题，提出了一种元算法，可以将任何强化学习算法转化为具有差分隐私的算法。研究结果表明，差分隐私强化学习算法可以实现合理的隐私-效用平衡。