基于影响的归因可以被操控

💡 原文中文,约1900字,阅读约需5分钟。
📝

内容提要

本研究揭示了对抗情况下基于影响的归因的可靠性问题,并提出了有效的攻击方法,对数据估值和公平性等应用的安全性有重要影响。

🎯

关键要点

  • 本研究揭示了对抗情况下基于影响的归因的可靠性问题。

  • 研究显示这些归因可能被系统性篡改,存在现实动机。

  • 提出了有效的攻击方法,并提供了向后兼容的实现。

  • 这一发现对数据估值和公平性等应用的安全性有重要影响。

➡️

继续阅读