Google DeepMind Blog ·

通用智能体

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

Gato是一个多模态、多任务的通用智能体，能够处理文本、图像和机器人控制等任务。它通过将不同任务的数据序列化为令牌，使用变换器神经网络进行训练，并在模拟和真实环境中积累经验，以生成相应的动作和文本。

🎯

关键要点

Gato是一个多模态、多任务的通用智能体，能够处理文本、图像和机器人控制等任务。
Gato使用相同的网络和权重，可以执行多种任务，如玩Atari游戏、为图像添加说明、进行对话和控制机器人手臂。
在训练阶段，Gato将不同任务和模态的数据序列化为令牌，并使用变换器神经网络进行处理。
Gato在训练中只预测动作和文本目标，使用掩码来控制损失计算。
在部署Gato时，初始序列由演示的提示和环境的观察组成，Gato逐步生成动作向量。
Gato在模拟和真实环境中积累了大量的训练数据，涵盖自然语言和图像数据集。
预训练的Gato模型在多个任务中的表现超过专家评分的百分比，显示其广泛的应用能力。

❓

延伸问答

Gato是什么类型的智能体？

Gato是一个多模态、多任务的通用智能体。

Gato是如何处理不同任务的？

Gato通过将不同任务的数据序列化为令牌，并使用变换器神经网络进行训练来处理不同任务。

Gato在训练阶段的主要目标是什么？

在训练阶段，Gato只预测动作和文本目标，使用掩码来控制损失计算。

Gato可以执行哪些具体任务？

Gato可以玩Atari游戏、为图像添加说明、进行对话和控制机器人手臂等。

Gato是如何在真实环境中积累经验的？

Gato在模拟和真实环境中积累了大量的训练数据，涵盖自然语言和图像数据集。

Gato的预训练模型表现如何？

预训练的Gato模型在多个任务中的表现超过专家评分的百分比，显示其广泛的应用能力。

🏷️

标签

Gato 任务处理变换器神经网络多模态智能体

➡️

继续阅读

百度文心助手任务Agent登顶国际权威榜单，超越Claude、GPT拿下全球智能体冠军
华为云高校公开课走进中山大学，聚焦智能体时代企业级开发能力建设
7月13日，华为云开发者发展与运营部部长林华鼎受邀走进中山大学深圳校区电子与通信工程学院，为30名学生带来《AI编程实战：重构学习生活，洞见企业级开发》专...
酷哇科技亮相WAIC 2026，解密行业首个双层智能体世界模型
机器人真正需要的世界模型，并不是单一物理世界模型，而是物理世界模型与人类社会世界模型的统一
OpenAI built support agents for its own customer service line, now it hopes big enterprises will trust them too
The general consensus emerging across the AI and industrial spheres is that t...
Building a serverless AI assistant at Pelago: concept to care in two weeks
Healthcare organizations face a critical scaling challenge – how to maintain ...
Visual Studio Code 1.130（Insiders）
Visual Studio Code 1.130 Insiders版本发布，新增功能更新。用户可通过提交日志和已关闭问题列表跟踪进展，鼓励大家尽快尝试新特性。