小红花·文摘

研究了语言模型在处理知识密集型任务时的困难和内部内存冲突对上下文的影响。引入了DYNAMICQA数据集，评估了内部内存冲突的不确定性，并提出了一种新的一致性说服评分来评估上下文对语义输出的影响。实验结果显示，时间性和有争议事实更容易通过额外的上下文进行更新。