小红花·文摘

本文提出了多种方法解决机器学习中的模型更新回归和可解释性问题，包括基准工具BEExAI、反事实训练方法XCR和反向兼容训练方法BCWI。这些方法在提高模型性能和解释性方面表现显著，尤其在处理数据更新和噪声数据集时。

属性解释与增强模型训练方法中的向后兼容性

BriefGPT - AI 论文速递 ·

本文评估了 RemOve-And-Retrain (ROAR) 协议的可靠性，发现其性能指标不受决策函数信息影响，并提出了 DoRaR 特征归属方法，以提高黑盒模型的透明度。同时，研究提出了 ART 训练方法，显著增强了解释的鲁棒性，并在多个数据集上取得最佳性能。此外，介绍了 eXplanation-based Counterfactual Retraining (XCR) 方法，旨在优化黑盒模型并解决解释性人工智能的问题。

几何去除和再训练（GOAR）：坐标不变可解释人工智能评估

BriefGPT - AI 论文速递 ·