谷歌最新研究表明,AI结合大模型与树搜索,在科学任务中实现超越人类的最新成果。该系统能自动生成实证软件,广泛应用于生物信息学和流行病学等领域,发现新方法并超越人类专家。研究指出,AI在可评分任务中表现优异,但也引发了关于科学研究权限交给AI的讨论。
研究团队提出了高效的树搜索框架Fetch,旨在解决大语言模型推理中的「过思考」和「欠思考」问题。通过合并冗余节点和抑制验证方差,Fetch显著提升了计算效率和准确率,尤其在复杂推理任务中表现出色。
本研究通过奖励引导树搜索算法提升大型语言模型的推理能力,结合政策模型和奖励模型,显著改善数学推理表现,展示了其潜在价值。
MuZero算法结合了基于树的搜索和学习模型,在多个具有挑战性和视觉复杂的游戏中实现超人类表现,无需知道游戏规则,性能与AlphaZero相当。
完成下面两步后,将自动完成登录并继续当前操作。