小红花·文摘

本研究评估了大型语言模型在科学文档推理中的表现，发现它们常使用虚假证据。检索增强语言模型（RALMs）通过结合外部数据源提高了预测精度和效率。研究还探讨了模型流畅度与属性的关系，并提出了改进方法。新提出的Retrieval-Pretrained Transformer（RPT）在多个任务中表现优于传统模型，显示出检索机制在知识密集型任务中的潜力。