信念修订:大型语言模型推理的适应性
📝
内容提要
从文本推理的能力对于现实世界的自然语言处理应用至关重要。现实场景通常涉及不完整或不断演化的数据,在这种情况下,个体会相应地更新其信念和理解。然而,大多数现有评估假设语言模型在处理一致信息时运行,我们引入了 Belief-R,这是一个新的数据集,旨在测试语言模型在面对新证据时的信念修订能力。受人类抑制先前推理的启发,该任务在新提出的 delta...
🏷️
标签
➡️