OpenAI推出的GPT-5.3-Codex模型是其最强大的编码模型,具备编码和推理能力,速度提升25%。该模型能够构建复杂的游戏和应用,理解用户意图,并处理网络安全任务。尽管在编码基准测试中表现优异,OpenAI强调其在实际应用中的进步,标志着向通用智能体的迈进。
Google DeepMind推出SIMA 2,这是一种基于Gemini模型的通用智能体,能够在多个3D虚拟环境中理解和行动。与前版本相比,SIMA 2具备制定多步计划和与用户讨论策略的能力。研究显示,该智能体在游戏测试中接近人类表现,并能在新环境中自我改进。SIMA 2的应用潜力包括机器人领域,但仍面临复杂任务的挑战。
AI 开发者面临的挑战在于通用智能体在实际业务中的表现不佳,原因是业务需要专门技能而非通用知识。Anthropic 提出的“技能”架构强调将经验转化为标准化操作手册和工具脚本,以提升智能体的应用能力,从而更好地满足企业需求,解决实际问题,创造商业价值。
国产AI产品Manus被誉为全球首款通用智能体,能够独立完成复杂任务,GAIA评分超越OpenAI。用户反响热烈,邀请码价格飙升。Manus可执行简历筛选、房产搜索和股票分析等多项功能,团队由90后创业者肖弘领导。
本研究探讨了多模态大型语言模型在传统语言和视觉任务之外的应用,提出了一种将其转化为通用具身智能体的方法。研究表明,跨域数据和在线强化学习对构建通用智能体至关重要,最终模型在新任务上展现出强大的泛化能力。
本文探讨了视觉语言模型(VLMs)在强化学习中的应用,提出了一种新方法,通过将VLMs作为策略初始化工具,提升复杂任务中的表现。研究表明,基于VLMs的策略优于传统方法,展示了其在三维世界理解和交互中的潜力,推动了通用智能体的发展。
本文探讨了通过大规模数据集训练通用智能体的方法,提出了RoboAgent和RoboNet系统,以提高机器人在多任务操作中的泛化能力和效率。研究表明,结合不同模态数据和策略优化,机器人能够在新场景中表现出色,并通过人类示范快速学习复杂任务。
完成下面两步后,将自动完成登录并继续当前操作。