小红花·文摘

本研究提出了LiveIdeaBench基准，用于评估大型语言模型在最小信息输入下的科学创造力和创意生成能力。研究表明，科学创造能力与一般智能指标存在显著差异，强调了专门评估框架的重要性。