机器之心 ·

给AI一个词就能测出科研创造力？人大高瓴团队最新研究：模型智商高未必最有创意

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

研究显示，AI的科研创造力与通用智能水平并不总成正比。中国人民大学的研究团队开发了LiveIdeaBench，通过四个维度评估AI创造力，发现高智商不等于高创造力，并推出新模型IdeaWhiz以促进科研创新。

🎯

🔎

研究表明，AI的科研创造力与其通用智能水平并不总是成正比。这一发现挑战了传统观念，提示我们在评估AI能力时，不能仅依赖智商指标。AI的创造力需要通过更全面的评估标准来衡量，以便更好地理解其在科研中的潜力。

LiveIdeaBench通过原创性、可行性、流畅性和灵活性四个维度来评估AI的科研创造力。这种多维度评估方法能够更全面地反映AI在不同领域的创新能力，尤其是在跨学科的科研应用中，灵活性和原创性显得尤为重要。

新开发的IdeaWhiz模型结合了推理与创造性思维，展现出在多个科研领域的强大创意能力。这一模型的开源使得科研人员能够更方便地利用AI进行创新，推动科学发现的进程，尤其是在复杂问题的解决上具有重要意义。

❓

研究发现，AI的科研创造力与通用智能水平并不总成正比，二者是相对独立的维度。

LiveIdeaBench通过原创性、可行性、流畅性和灵活性四个维度评估AI的科研创造力。

IdeaWhiz模型结合了推理与创造性思维，能够在多个领域展现强大的创意能力。

研究团队测试了包括OpenAI的o1、Google的Gemini和Anthropic的Claude在内的20个主流大模型。

不一定，研究表明高智商不等于高创造力，AI的发展需要在聪明与有创意之间找到平衡。

LiveIdeaBench采用动态评审机制，由多个顶尖模型组成评审团，每月更新一次，以保证评测的公平性和时效性。

🏷️