量子位 ·

华为发布业界首个扩散语言模型Agent，部分场景提速8倍！

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

华为发布的扩散语言模型DLLM Agent提升了执行速度超过30%，在复杂任务中效率可达传统模型的8倍。研究显示，DLLM在多轮推理和工具调用中展现出更强的规划能力，减少了交互次数，优化了任务执行路径，为Agent设计提供了新视角，强调生成范式对行为方式的影响。

🎯

关键要点

华为发布的扩散语言模型DLLM Agent提升了执行速度超过30%。
在复杂任务中，DLLM Agent的效率可达传统模型的8倍。
DLLM在多轮推理和工具调用中展现出更强的规划能力，减少了交互次数。
研究团队采用严格的对照实验设计，确保实验结果的可靠性。
DLLM Agent在准确率持平的情况下，平均工具调用次数显著减少，轨迹更短。
DLLM Agent的planner能力更强，能更早收敛到正确轨迹，回溯和冗余更少。
DLLM的生成模式在任务拆解和工具调用阶段表现出独特的两阶段特征。
研究表明生成范式深刻影响Agent的行为方式，DLLM为构建高效Agent提供了新视角。

❓

延伸问答

华为的DLLM Agent相比传统模型有哪些优势？

DLLM Agent在复杂任务中效率可达传统模型的8倍，执行速度提升超过30%，并且在准确率持平的情况下，减少了交互次数和工具调用。

DLLM Agent的规划能力有什么特点？

DLLM Agent展现出更强的规划能力，能更早收敛到正确轨迹，回溯和冗余更少，优化了任务执行路径。

研究团队如何确保DLLM Agent实验结果的可靠性？

研究团队采用严格的对照实验设计，确保使用相同的Agent框架、工具接口和任务，唯一变化因素为生成范式。

DLLM的生成模式对Agent行为有什么影响？

生成范式深刻影响Agent的行为方式，DLLM Agent在任务拆解和工具调用阶段表现出独特的两阶段特征，提升了执行效率。

DLLM Agent在多轮推理中表现如何？

在多轮推理中，DLLM Agent能够更快识别关键信息，减少交互轮次，提升整体效率。

DLLM Agent的不足之处是什么？

DLLM在处理结构化输出时更敏感，可能产生结构化tool-call错误，需要针对性调整训练策略以提升推理性能。

🏷️

继续阅读

原华为盘古大模型负责人王云鹤离职创业；苹果硬件负责人启动重大重组；OpenAI联合创始人加入Anthropic
近期多家科技公司高管频繁变动。华为盘古大模型负责人王云鹤离职创业，成立新公司“基元律动”；阿里副总裁张凯夫也离职创业，专注市场行为预测；苹果硬件部门进行重...
教你薅token（二）：构建agent无关的skills管理工作流
本文介绍了pks（个人技能管理器），一个用纯bash编写的工具，旨在管理AI工作流文档。pks允许用户集中管理特定项目的技能，如编码规范和API设计，并按...
扣子3.0实测：手机就能远程遥控你电脑里的Agent
扣子3.0正式发布，升级了AI团队协作功能。用户可通过简单指令调动多个专业Agent共同完成复杂任务，如制作网页Demo和视频方案。新版本支持多端同步，能...
字节Agent自主优化GPU内核：挑战英伟达CUDA护城河
字节跳动开发的AI CUDA Agent能够自主优化CUDA代码，其性能超越人类专家40%。该AI通过强化学习快速发现传统编译器无法识别的优化技巧，可能会...
人工智能论文评审：通过人类反馈训练语言模型以遵循指令（InstructGPT）
GPT-3在自然语言处理上取得了重大突破，但未能有效转化为助手。为此，OpenAI推出了InstructGPT，通过人类反馈训练模型更好地遵循指令，强调模...
h5i Radio – 利用 Git，让 Claude 和 Codex 进行实时对话
h5i 是一个开源工具，支持多个 AI Agent（如 Claude 和 Codex）通过 Git 协作。其 Agent Radio 功能利用 Git 仓...