谷歌的Gemini 2.5 Deep Think模型通过平行思维技术解决创造性问题,在2025年国际数学奥林匹克中表现优异,获得金牌。新版本在推理深度和速度之间取得平衡,适合日常使用,采用新型强化学习技术,支持多模态输入,尽管存在查询限制,但在多个基准测试中表现出色。
研究通过'MacGyver'数据集探讨大型语言模型在受限环境中的创造性问题解决能力,包含1,600个创新问题。结果显示,LLMs与人类在解决这些问题时各有挑战且互补。研究分析了LLMs的错误,并展示了通过新提示技术提升其能力的潜力,揭示了人类与AI在创造性问题解决上的异同。
完成下面两步后,将自动完成登录并继续当前操作。