Apple Machine Learning Research ·

DiffuCoder：理解与改进用于代码生成的掩蔽扩散模型

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

扩散大语言模型（dLLMs）在代码生成中表现优异，尤其在去噪和全局规划方面。我们训练了一个7B参数的dLLM模型DiffuCoder，并分析其解码行为，发现其生成方式与自回归模型不同。我们提出的新采样方案coupled-GRPO显著提升了DiffuCoder在代码生成基准上的表现，并减少了对自回归偏差的依赖。

🎯

关键要点

扩散大语言模型（dLLMs）在代码生成中表现优异，尤其在去噪和全局规划方面。
我们训练了一个7B参数的dLLM模型DiffuCoder，并分析其解码行为。
DiffuCoder的生成方式与自回归模型不同，能够独立决定生成的因果性。
增加采样温度不仅多样化了标记选择，还改变了生成顺序，创造了丰富的搜索空间。
我们提出的新采样方案coupled-GRPO显著提升了DiffuCoder在代码生成基准上的表现。
coupled-GRPO减少了对自回归偏差的依赖，提升了训练效率。
我们的研究为dLLM生成机制提供了更深入的见解，并提出了有效的扩散原生强化学习训练框架。

🏷️

继续阅读

AI编码代理可以编写代码，Crafting希望帮助他们交付
Crafting CEO Sumeet Vaidya表示，六到九个月前，大家关注AI代理的快速代码生成，但他和联合创始人意识到，工程组织在扩展时面临协调和资源使用等挑战。
基于华为云码道，快速开发个人任务管理系统
华为云码道（CodeArts）提供智能开发工具，帮助用户快速构建个人任务管理系统。该系统简洁高效，支持任务管理、筛选和本地数据保存，用户可通过指令生成代码...
Google Stax：根据您自己的标准测试模型和提示
Google的Stax工具允许个人创建和评估机器学习模型，通常与TensorFlow或Vertex AI协作，专注于模型性能评估。
在Microsoft 365 Copilot中利用Dataverse构建业务理解
Dataverse模型上下文协议(MCP)服务器为代理提供了安全的业务数据交互方式，支持记录的插入、更新、读取、搜索和执行提示，简化了开发者的工作。
龙虾最大痛点被官方插件升级！对话永不忘记，GPT和Gemini最强模型都可接入
龙虾发布了OpenClaw测试版，新增上下文管理插件，增强对话记忆能力，支持多种上下文策略，解决长对话中的信息丢失问题。lossless-claw插件可持...
龙虾最佳适配模型，OpenClaw之父给出了推荐
PinchBench榜单显示，中国模型在成功率和速度上表现优异，特别是MiniMax M2.5超越其他模型。尽管价格较高，该榜单为模型选择提供了明确参考。...

DiffuCoder：理解与改进用于代码生成的掩蔽扩散模型

内容提要

关键要点

标签

继续阅读