本研究评估了大型语言模型在科学文档推理中的表现,发现它们常使用虚假证据。检索增强语言模型(RALMs)通过结合外部数据源提高了预测精度和效率。研究还探讨了模型流畅度与属性的关系,并提出了改进方法。新提出的Retrieval-Pretrained Transformer(RPT)在多个任务中表现优于传统模型,显示出检索机制在知识密集型任务中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。