小红花·文摘

本研究评估了大型语言模型在科学文献推理中的表现，发现它们常使用虚构证据。提出了NLP-KG系统以改善文献搜索，并通过混合策略提升模型在科学任务中的理解能力。研究表明，LLM在生成研究创意方面优于人类，强调了系统性调查任务指令的重要性。