公平目标对抗训练:通过有针对性的对抗训练提升模型公平性
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究表明,类别间距离减小时,鲁棒公平性会恶化。为此,提出了“距离感知的公平对抗训练(DAFA)”方法,通过调整损失权重和对抗边界来改善鲁棒公平性。实验结果表明,该方法在鲁棒准确性方面优于现有方法。
🎯
关键要点
- 研究表明,类别间距离减小时,鲁棒公平性会恶化。
- 提出了“距离感知的公平对抗训练(DAFA)”方法来改善鲁棒公平性。
- DAFA方法通过调整损失权重和对抗边界来解决鲁棒公平性问题。
- 实验结果显示,DAFA在鲁棒准确性方面优于现有方法。
- DAFA方法不仅提高了平均鲁棒准确性,还显著改善了最差鲁棒准确性。
➡️