量子位 ·

LeCun团队开源首个代码世界模型：能生成代码还能自测自修！传统编程模型一夜成古典

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

Meta FAIR推出了首个代码世界模型CWM，具备生成、理解和调试代码的能力，参数为32B，支持131k token。CWM通过动态执行模拟和自我修复，提升了代码生成的准确性，接近GPT-4水平。该模型开源，旨在推动编程研究。

🎯

🔎

CWM的推出标志着代码生成领域的一次重大突破。通过引入代码世界建模，模型不仅能生成代码，还能理解代码执行过程中的状态变化。这种动态理解能力使得CWM在调试和修复代码时表现出色，接近人类程序员的思维方式，推动了编程研究的前沿。

尽管CWM在代码生成和推理方面表现优异，但目前仅支持Python语言，尚未扩展到其他主流编程语言。此外，CWM主要面向研究用途，不适合商业应用或对话任务，用户在使用时需注意这些限制。

CWM的训练分为三个阶段，涵盖了从通用语言建模到世界建模的复杂过程。特别是在中期训练阶段，模型通过大量的执行轨迹数据学习代码运行时的状态变化，这一过程为模型的高效推理和生成能力奠定了基础。

❓

CWM模型具备生成、理解和调试代码的能力，能够模拟代码执行过程中的状态变化。

CWM模型的参数为32B，支持131k token的上下文。

CWM通过动态执行模拟和自我修复来提升代码生成的准确性。

CWM模型的训练分为预训练、中期训练和后训练三个阶段。

目前CWM模型仅支持Python语言，未来将探索多语言扩展。

CWM模型主要面向代码理解与复杂推理研究，不适合对话任务或商业使用。

🏷️