在可读性水平控制下的自由文本论据生成
原文中文,约400字,阅读约需1分钟。发表于: 。大型语言模型在不同可读性级别下进行自然语言解释任务,发现解释可以适应不同的指导,但请求的可读性经常与传统可读性评估指标不一致。该研究还发现,评估大型语言模型生成的解释时,其对于文本复杂度的评估呈现出与自然语言生成中观察到的类似偏好。最后,人类评估表明在不同可读性级别下的解释总体印象令人满意,其中高中级别的可读性最常见且受欢迎。
本研究探讨了大型语言模型(LLM)如何解释其生成的模式,使用基于归因和基于提示的方法提取LLM原因,并发现基于提示的方法更好地对齐人工注释的原因。通过微调模型,无论是基于提示还是归因的方法都展现了更好的忠实度。该研究为更严格和公正地评估LLM原因提供了启示。