本研究提出了一种概念相似性推理网络(CSR),旨在提升计算机辅助诊断中的模型决策解释与干预能力。CSR通过提供图像区域的概念原型,实现了补丁级别的解释和空间交互,在三个生物医学数据集上可解释性性能最高提高4.5%。
本研究探讨大型语言模型(LLMs)在检测冒犯性语言时的人类注释分歧问题。研究发现,LLMs对注释分歧样本的信心与人类一致性相关,这些分歧影响模型决策,为改进冒犯性语言检测提供了指导。
本研究探讨了深度神经网络可解释性的局限性,提出稀疏分布向量表征作为替代方案。实验结果表明,稀疏分布表征更易理解,且对模型决策的贡献更大,突显其在可解释性方面的优势。
完成下面两步后,将自动完成登录并继续当前操作。