Deepseek V3.1 引爆A股！神秘代码 UE8M0 揭秘，华为升腾背后的“国运”豪赌

硕鼠的博客站 ·

Deepseek V3.1 引爆A股！神秘代码 UE8M0 揭秘，华为升腾背后的“国运”豪赌

💡 原文中文，约7100字，阅读约需17分钟。

📝

内容提要

DeepSeek V3.1的发布引发市场关注，尽管性能提升不明显，但因UE8M0和FP8的参数精度适配国产芯片而受到重视。文章分析了UE8M0的计算精度演变及其对大模型的影响，强调国产算力芯片与国际技术的关系，并警示未来发展需谨慎。

🎯

关键要点

DeepSeek V3.1发布引发市场关注，尽管性能提升不明显，但因UE8M0和FP8的参数精度适配国产芯片而受到重视。
DeepSeek V3.1的上下文长度升级至128K，工具调用能力增强，符合AI agent需求。
市场对DeepSeek V3.1的关注主要源于其使用UE8M0和FP8参数精度，吸引了投资者的目光。
UE8M0是一种马赛克格式，具有特定的计算精度特性，影响大模型的计算效率。
计算精度演化过程中，FP32逐渐被FP16和FP8取代，降低精度对结果影响不大。
DeepSeek V3.1在训练时使用FP16和FP8，后续针对UE8M0进行量化优化。
UE8M0的优势在于内存搬运减少，适应国产算力芯片的需求。
华为升腾芯片支持FP8，并为UE8M0进行优化，MindSpore框架支持相关应用。
DeepSeek V3.1的UE8M0版本需在特定架构下训练，其他模型难以实现此量化。
未来发展需谨慎，建议继续跟随国际主流技术路线，避免走向极端的UE8M0方向。

❓

延伸问答

DeepSeek V3.1的主要特点是什么？

DeepSeek V3.1的主要特点是使用UE8M0和FP8参数精度，适配国产算力芯片，且上下文长度升级至128K，增强了工具调用能力。

UE8M0是什么，它的优势是什么？

UE8M0是一种马赛克格式，具有特定的计算精度特性，优势在于内存搬运减少，适应国产算力芯片的需求。

为什么DeepSeek V3.1在市场上引起了关注？

DeepSeek V3.1因其使用UE8M0和FP8参数精度，适配国产芯片而受到市场关注，尤其是在投资者中引发热潮。

DeepSeek V3.1如何进行模型训练和量化？

DeepSeek V3.1在训练时使用FP16和FP8，训练完成后针对UE8M0进行量化优化，以适应特定架构。

华为升腾芯片与DeepSeek V3.1的关系是什么？

华为升腾芯片支持FP8，并为UE8M0进行优化，MindSpore框架支持相关应用，促进了DeepSeek V3.1的性能提升。

未来DeepSeek V3.1的发展方向是什么？

未来发展需谨慎，建议继续跟随国际主流技术路线，避免走向极端的UE8M0方向，以确保国内大模型的健康发展。

🏷️

继续阅读

Anthropic 抢跑 IPO，AI 巨头接连秘密上市，背后是怎样的攻防战
从六月开始，SpaceX、OpenAI和Anthropic三家公司计划进行IPO，估值可能超过2000年以来所有美国风投支持的IPO总和。三家公司选择秘密...
黄仁勋一句话说透软件未来：不是写代码，是OODA转圈圈
黄仁勋提出OODA循环（观察、判断、决策、行动）是软件未来的核心，强调软件应动态迭代而非静态开发。英伟达利用这一框架提升团队决策和反馈效率，推动软件开发的...
再见样板代码！Go 官方新提案：函数一键转接口
Go 语言提出了一项新提案，允许将函数显式转换为单方法接口，以减少样板代码。这一提案旨在简化代码结构，提高可读性，同时保持类型安全。通过显式转换，程序员可...
华为发布 nova 16 系列：2 亿主摄，红枫影像，还有十年的答案
华为于6月1日在成都发布了nova 16系列手机，包括nova 16z、16、16 Pro和16 Ultra。新系列主打2亿像素主摄，搭载麒麟9010S芯...
兑现收据 — v5的诞生
在与伊比利亚高速公路集团合规主任的会议中，团队通过头脑风暴将想法转化为工作演示。开发者发现指令中的错误，导致报告未能生成。经过调整，报告成功生成，包含八个...
如何观看微软Build 2026开发者大会
微软将在旧金山举行Build 2026开发者大会，重点关注人工智能。CEO纳德拉将在6月2日的主题演讲中介绍新机会。会议将在线免费直播，注册后可参加多个与...