张善友 ·

DeepSeek采用的UE8M0 FP8 为什么引爆了A股的芯片板块 - 张善友

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

DeepSeek-V3.1采用UE8MO FP8参数精度，显著提升AI模型训练效率，降低显存占用，支持国产芯片发展，助力应对技术封锁。

🎯

关键要点

DeepSeek-V3.1采用UE8MO FP8参数精度，提升AI模型训练效率。
V3.1对分词器及chat template进行了较大调整，与DeepSeek-V3存在明显差异。
UE8MO FP8是针对下一代国产芯片设计的缩放因子格式。
MXFP8格式通过块缩放和硬件原生支持提升计算效率和降低显存占用。
MXFP8能带来计算效率提升、显存占用降低和功耗降低。
国产AI芯片厂商积极布局MXFP8等低精度格式的支持，构建软硬协同生态。
支持MXFP8有助于缩小国产芯片与国际顶尖产品的性能差距。
选择支持MXFP8的国产AI芯片时需确认原生支持、软件生态和实际性能。

❓

延伸问答

UE8M0 FP8是什么，它的主要特点是什么？

UE8M0 FP8是一种缩放因子格式，结合了微缩块技术，能有效提升大模型训练效率，降低显存占用。其主要特点包括支持低精度计算、硬件友好性和动态范围大。

DeepSeek-V3.1如何利用UE8M0 FP8提升AI模型训练效率？

DeepSeek-V3.1通过采用UE8M0 FP8参数精度，显著提升了AI模型训练效率，降低了显存占用，支持国产芯片的发展。

MXFP8格式的优势是什么？

MXFP8格式通过块缩放和硬件原生支持，能提升计算效率、降低显存占用和功耗，特别适合大模型训练和推理。

国产AI芯片厂商如何布局MXFP8支持？

国产AI芯片厂商积极布局MXFP8等低精度格式的支持，通过软硬协同生态构建，优化算法和软件层面，提升芯片性能。

选择支持MXFP8的国产AI芯片时需要考虑哪些因素？

选择时需确认芯片是否原生支持FP8计算、软件生态的适配情况、实际性能表现及量产进度。

UE8M0 FP8如何应对技术封锁带来的挑战？

支持UE8M0 FP8等先进格式有助于缩小国产芯片与国际顶尖产品的性能差距，推动国产算力发展，尤其在技术封锁背景下尤为重要。

🏷️

继续阅读

【公益译文】2026年AI指数报告（三）
AI模型在语言、推理、编码和数学等领域的能力迅速提升，评估工具的可靠性受到质疑。美国与中国的顶级模型差距缩小，竞争转向成本和实际应用价值。基准测试显示模型...
摩根士丹利称搭载英伟达RTX SPARK N1X芯片的PC售价将达到2,900美元
摩根士丹利预测，搭载英伟达RTX SPARK N1X芯片的PC售价将达到2900美元，N1芯片设备售价为1800美元。这些高性能芯片主要面向开发者和内容创...
早报｜曝苹果Vision Pro系列被砍/多地高考将查验智能眼镜/DeepSeek首轮融资规模约500亿元
苹果智能眼镜产品线调整，仅剩两款，Vision Pro系列被取消。DeepSeek计划融资500亿元，腾讯和宁德时代为主要投资者。高考将查验智能眼镜，考生...
Nvidia已在规划N2X和N3X芯片——目标是《星际迷航》电脑
Nvidia首席执行官黄仁勋在2026年台北的Computex上宣布将推出N2X和N3X芯片，旨在实现类似《星际迷航》的智能电脑，用户可通过语音与电脑互动...
给 WordPress 7.0 的 AI 连接功能加上 DeepSeek 支持
WordPress 7.0 更新了 AI 连接功能，但仅支持国外提供商。为此，开发者推出了 WPJAM AI 插件，支持国内的 DeepSeek 等模型。...
DeepSeek首轮500亿元融资细节曝光：估值4000亿，腾讯、宁德时代都来了
国内AI企业DeepSeek即将完成首轮融资，计划募资约500亿元，投资方包括腾讯和宁德时代。融资后估值预计达3500亿至4000亿元。创始人梁文锋将投入...