本文介绍了LIREx框架,通过原因解释生成器和实例选择器提升NLI模型性能。采用三步学习算法和SELF-REFINE框架优化语言模型输出,并探讨大型语言模型的解释技术在安全性和信任建立中的重要性,提出ART推理与改进目标,以提升生成解释质量。
本文探讨了大型语言模型的可解释性和实用性,提出了自动化评分系统GEN-U来评估其帮助性。研究发现,众包工作者更倾向于基于知识的解释,尽管模型生成的解释更受欢迎,但需提升简明性和新颖性。研究旨在提高生成解释的可信度。
完成下面两步后,将自动完成登录并继续当前操作。