2025 年终总结:当时只道是寻常

💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

由于创业,2025年过得很快,缺乏时间进行记录和反思。文章回顾了技术与生活,提到DeepSeek和vLLM的开发经历,讨论了AI基础设施的变化及个人旅行,强调珍惜平凡的日子。

🎯

关键要点

  • 由于创业,2025年过得很快,缺乏时间记录和反思。

  • 一月份DeepSeek的出现让我震撼,部署了小版本并发现vLLM对其支持不足。

  • 为vLLM提交了PR以支持DeepSeek的推理内容,经过社区审核后成功合并。

  • 尽管对模型推理市场前景不看好,但性能优化和系统设计的挑战依然吸引我。

  • 参与了基于LMCache和vLLM的可扩展推理服务的工作。

  • 实现了torch.distributed作为多节点推理的运行时,简化了分布式推理的复杂性。

  • Kubernetes的调度能力在AI基础设施中变得不可或缺。

  • 美国科技巨头在AI基础设施上的资本支出达到3000亿美元,显示出AI的战略重要性。

  • 大语言模型的预训练可能面临瓶颈,资本支出并不一定能直接反映技术进步。

  • Agent基础设施的需求尚不明确,传统基础设施未发生根本性变革。

  • 今年3月与朋友去日本旅游,体验了大阪的繁华与武汉的美食。

  • 在美国加州生活成本高,但湾区的风景非常美丽。

  • 今年玩了较少的游戏,但重新体验了燕云十六声,感到惊喜。

  • 珍惜平凡的日子,回忆起已故的猫,感慨普通生活的珍贵。

延伸问答

2025年过得快的原因是什么?

由于创业的缘故,2025年过得特别快,缺乏时间记录和反思。

DeepSeek和vLLM的开发经历如何?

DeepSeek的出现让我震撼,发现vLLM对其支持不足,因此我提交了PR以支持DeepSeek的推理内容,最终成功合并。

AI基础设施的资本支出情况如何?

今年,美国科技巨头在AI基础设施上的资本支出达到3000亿美元,显示出AI的战略重要性。

大语言模型的预训练面临哪些挑战?

大语言模型的预训练可能面临瓶颈,资本支出并不一定能直接反映技术进步。

作者在日本旅游的经历如何?

作者与朋友在日本大阪旅游,体验了繁华的道頓堀和美食,但觉得长期生活在这样的城市会很疲惫。

文章中提到的生活感悟是什么?

作者回忆起已故的猫,感慨普通生活的珍贵,强调珍惜平凡的日子。

➡️

继续阅读