小红花·文摘

本文探讨了自然语言处理中的模型可解释性，提出了多种提高模型解释能力和鲁棒性的方法。研究表明，注释质量和过程对可解释性有显著影响，神经语言模型的解释能力存在局限。通过引入新的特征评分方法和多阶段培训，研究者旨在生成更准确的解释，并提升模型在不同任务中的表现。