本研究评估了大型语言模型在科学文献推理中的表现,发现它们常使用虚构证据。提出了NLP-KG系统以改善文献搜索,并通过混合策略提升模型在科学任务中的理解能力。研究表明,LLM在生成研究创意方面优于人类,强调了系统性调查任务指令的重要性。
完成下面两步后,将自动完成登录并继续当前操作。