局部无关视频解释:基于移除的解释在视频中的适用性研究
原文中文,约500字,阅读约需2分钟。发表于: 。本文提出了一个针对视频领域的统一框架,旨在在维持高学习性能的同时,通过融合时序信息和实现局部解释,扩展针对计算机视觉数据的细粒度解释框架,并将六种现有的解释技术应用于视频数据,进行了评估和比较研究。研究结果表明,3D RISE、3D LIME 和 3D Kernel SHAP 优于其他方法。通过将解释过程分解为可管理的步骤,我们便于研究每个选择的影响,并进一步改进解释方法以适应特定的数据集和模型。
深度学习算法在计算机视觉任务中取得进展,但其可解释性受到关注。可解释人工智能(XAI)旨在揭示人工智能模型的决策过程。该研究提出了一个XAI基准,包括不同主题的数据集,为图像提供类别标签和解释注释。还综合评述了超过10种视觉解释评估方法。希望该基准推动视觉解释模型的进步。