硅众智慧:LLM 集合预测能力能媲美人工智能准确性
原文中文,约400字,阅读约需1分钟。发表于: 。人类预测准确性依赖于 “群体智慧” 效应,即通过对一群个体预测者进行聚合,可以显著提高对未来事件的预测。本研究通过使用由 12 个大型语言模型(LLM)组成的群体,扩展了过去关于大型语言模型作为预测者的研究。结果表明,通过简单且实际可行的预测聚合方法,LLMs 能够获得与人类群体预测锦标赛相媲美的准确性,从而复制了 “群体智慧” 效应,为 LLMs 在社会各个领域的应用开辟了可能。
研究发现LLMs在模仿人的行为方面显示出潜力,尤其是在众包任务方面。成功程度受多个因素影响,包括请求者对LLMs能力的理解、子任务所需技能和最佳互动模式。强调为LLMs提供面向人类的保障的重要性,探讨培养人类和LLMs具备互补技能的潜力。展示了LLMs在不同任务上的相对优势和复杂任务中的潜力。