小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

仅仅一年后,AlphaZero 横空出世——没有人类棋谱、没有经验指导,只靠自我博弈,便在短时间内超越了所有 AlphaGo...

从 AlphaGo 到 AlphaZero:企业智能化的三重进化

dotNET跨平台
dotNET跨平台 · 2025-10-20T00:01:28Z

DeepMind与UCL等机构合作推出RoboBallet,利用图神经网络和强化学习实现8个机械臂的高效协作。该系统能快速处理复杂任务,规划速度达到每步0.3毫秒,展现出优越的实时性和泛化能力,适用于自动化制造等领域。

AlphaGo作者领衔,DeepMind新作登Science子刊

量子位
量子位 · 2025-09-14T06:33:31Z

Reflection AI成立一年,目标融资10亿美元,开发开源大语言模型Asimov,专注于代码理解。创始人曾参与AlphaGo开发,受中国开源AI影响,力争成为美国领先供应商。

AlphaGo开发者创业挑战DeepSeek,成立仅一年目标融资10亿美元

量子位
量子位 · 2025-08-06T06:17:00Z
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了

DeepMind的研究提出了“苏格拉底式学习”,使AI系统在封闭环境中自我完善,超越初始数据的限制。通过“语言游戏”,智能体能够自主生成数据并提升技能,强调反馈和数据覆盖的重要性。这一方法为实现通用人工智能开辟了新路径,展示了AI自我改造的潜力。

DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了

机器之心
机器之心 · 2024-12-02T05:24:08Z

LLaMA版o1项目由上海AI Lab发布,结合蒙特卡洛树搜索与强化学习,开源代码引发关注。该模型在数学奥赛测试中表现优异,优化后正确率显著提升。团队还推出了包含长思维链的预训练数据集,支持进一步训练。同时,上交大团队的O1-Journey项目也在推进中。

Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式

量子位
量子位 · 2024-11-05T06:32:24Z
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

谷歌DeepMind的核心作者Julian Schrittwieser宣布加入Anthropic,结束了十年的DeepMind生涯。他参与了AlphaGo、AlphaZero和MuZero等重要项目,推动了强化学习的发展。业界对此举表示关注,期待他在Anthropic的表现。

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

机器之心
机器之心 · 2024-10-29T06:25:30Z
哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合

2023年,DeepMind与Google Brain合并成立了Google DeepMind,旨在推动AI产品研究和进步。Google DeepMind的目标是发明下一个推动AI前沿的架构,并在多模态理解、长期记忆和推理能力等方面进行改进。哈萨比斯还谈到了开源模型的问题,认为前沿模型需要经过更多审核,发布一到两年后才能开源。他还提到了AGI的测试标准,以及如何确保AGI能够使每个人受益。

哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合

机器之心
机器之心 · 2024-08-20T06:34:00Z

谷歌DeepMind开发了一款使用ABB的IRB 1100机械手的乒乓球机器人,通过摄像头捕捉球的轨迹和人的动作,展示了机器人的潜力。未来可能发展成两条腿的机器人,应用于其他领域。

从AlphaGo到AlphaPong:Google DeepMind推出乒乓球机器人。使用ABB IRB1100,可以和普通人打得有来有回,中国的乒乓优势,还能保持多久?

硕鼠的博客站
硕鼠的博客站 · 2024-08-12T00:49:09Z
被 AlphaGo 击败的李世石,用 8 年重建崩塌的世界

李世石在接受采访时表示,被AlphaGo击败后,他感到整个世界都塌了。AI技术的发展对围棋界产生了巨大影响,人类棋手的判断能力得到提升。围棋界也面临着AI作弊的问题,但同时也有人利用AI的弱点来击败它。围棋界的AI仍存在许多问题。

被 AlphaGo 击败的李世石,用 8 年重建崩塌的世界

爱范儿
爱范儿 · 2024-07-22T01:58:56Z

本文改进了Coquelin和Munos(2007)的证明,证明了在D链环境上,UCT算法可能导致指数级的遗憾。同时使用证明方法对AlphaGo的MCTS及其后继算法演示了相同的遗憾程度。

关于 UCT、AlphaGo 及其变种的超指数遗憾

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z

李赛多尔是一位职业围棋选手,与AlphaGo进行了一场著名的比赛。他低估了人工智能的强大,但认为人类可以与之合作取得进步。

8年后:围棋世界冠军对AlphaGo的反思

The Keyword
The Keyword · 2024-03-19T18:15:00Z

【阅读时间】21min - 24min 10999字【内容简介】AlphaGo1.0详解链接,这篇AlphaGo Zero论文原文超详细翻译,并且总结了AlphaGo Zero的算法核心思路,附带收集了网上的相关评论

深入浅出看懂AlphaGo元

遥行 Gofurther 技术&ML&BC博客
遥行 Gofurther 技术&ML&BC博客 · 2017-10-18T12:54:32Z

【阅读时间】15min 8506 words【阅读内容】针对论文AlphaGo第一版本,进行了详细的说明和分析,力求用通俗移动的语言让读者明白:AlphaGo是如何下棋的

深入浅出看懂AlphaGo如何下棋

遥行 Gofurther 技术&ML&BC博客
遥行 Gofurther 技术&ML&BC博客 · 2017-05-27T03:51:22Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码