蓝点网 ·

DeepSeek-V3-0324 685B模型可以在M3 Mac Studio上以每秒20toks本地运行

💡 原文中文，约1100字，阅读约需3分钟。

📝

内容提要

DeepSeek推出V3-0324模型，能在512GB内存的Mac Studio上以20toks/s的速度运行，性能超越Claude 3.5。该模型遵循MIT许可证，允许免费使用和开发。尽管更新引发关注，DeepSeek却低调发布，未附带宣传材料。

🎯

🔎

DeepSeek V3-0324模型在性能上超越了Claude 3.5，展示了其在处理复杂任务时的强大能力。这一进步意味着开发者可以在更广泛的应用场景中利用该模型，尤其是在需要高效文本生成的领域。

DeepSeek V3-0324遵循MIT许可证，允许个人和企业免费使用及开发衍生产品。这种开源策略不仅降低了使用门槛，还鼓励了社区的创新，可能会催生出更多基于该模型的应用和工具。

与其他AI公司的高调宣传形成对比，DeepSeek的低调发布可能会影响其市场认知度。虽然技术实力强大，但缺乏宣传可能导致潜在用户对其产品的了解不足，从而影响其市场渗透率。

❓

该模型在512GB内存的Mac Studio上以每秒20toks的速度运行。

V3-0324模型的性能超越Claude 3.5，具有巨大的能力提升。

该模型遵循MIT许可证，允许个人和企业免费使用和开发衍生产品。

DeepSeek低调发布了V3-0324模型，没有附带宣传材料，只有空白的README文件和模型权重。

开发者@Awnihannun在配备512GB内存和M3 Ultra芯片的Mac Studio上使用Python开源库MLX-LM成功运行了该模型。

该模型拥有685B参数。

🏷️