DEV Community ·

不，华尔街，DeepSeek并不“远远优越”

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

DeepSeek V3和R1的市场反应显示了公众的短视。DeepSeek并不优于所有模型，GPT-4o和Gemini-2表现更佳。训练成本被夸大，实际与同类模型相当。尽管DeepSeek表现优秀，但Nvidia的硬件仍然重要，未来模型将继续改进。

🎯

🔎

DeepSeek V3和R1的市场反应显示了投资者对新技术的短视。尽管DeepSeek在某些方面表现出色，但与GPT-4o和Gemini-2相比，其整体性能并不占优。这提醒我们在评估新产品时，需关注全面的性能数据，而非单一的市场热度。

关于DeepSeek的训练成本，公众普遍认为其成本远低于同类模型，实际上这一说法并不准确。6百万美元的成本仅是最终训练的费用，未考虑早期实验和研发支出。这表明在评估技术时，需深入了解其成本构成，避免误解。

尽管DeepSeek在性能上表现良好，但其训练依赖于Nvidia的硬件，这意味着硬件仍然是大型语言模型成功的关键因素。未来模型的进步可能会继续推动对高性能硬件的需求，尤其是对于小型企业而言，购买更多GPU将成为常态。

❓

DeepSeek V3和R1的市场反应显示了公众的短视，认为其优于所有模型，但实际上并非如此。

DeepSeek并不优于所有模型，GPT-4o和Gemini-2的表现更佳。

DeepSeek的训练成本被夸大，实际与同类模型相当，最终训练运行的成本约为600万美元。

DeepSeek是在Nvidia的硬件上训练的，Nvidia的硬件仍然重要。

DeepSeek使大型语言模型对本地客户更易获取，促进小型企业购买更多GPU。

未来模型将继续改进，股票将恢复，进步将继续推进。

🏷️