通过同义词加权相似性度量提高自然语言可解释人工智能中的鲁棒性估计

📝

内容提要

本研究针对可解释人工智能(XAI)领域中对解释可靠性的不满,提出了一种新的利用同义词加权的相似性度量方法,以改进现有在使用对抗样本时的鲁棒性估计。研究结果表明,此方法能够提供更准确的对抗示例下的XAI方法脆弱性评估,提升了对抗攻击的有效性分析。

🏷️

标签

➡️

继续阅读