2025 年终总结:当时只道是寻常
💡
原文中文,约4200字,阅读约需10分钟。
📝
内容提要
由于创业,2025年过得很快,缺乏时间进行记录和反思。文章回顾了技术与生活,提到DeepSeek和vLLM的开发经历,讨论了AI基础设施的变化及个人旅行,强调珍惜平凡的日子。
🎯
关键要点
- 由于创业,2025年过得很快,缺乏时间记录和反思。
- 一月份DeepSeek的出现让我震撼,部署了小版本并发现vLLM对其支持不足。
- 为vLLM提交了PR以支持DeepSeek的推理内容,经过社区审核后成功合并。
- 尽管对模型推理市场前景不看好,但性能优化和系统设计的挑战依然吸引我。
- 参与了基于LMCache和vLLM的可扩展推理服务的工作。
- 实现了torch.distributed作为多节点推理的运行时,简化了分布式推理的复杂性。
- Kubernetes的调度能力在AI基础设施中变得不可或缺。
- 美国科技巨头在AI基础设施上的资本支出达到3000亿美元,显示出AI的战略重要性。
- 大语言模型的预训练可能面临瓶颈,资本支出并不一定能直接反映技术进步。
- Agent基础设施的需求尚不明确,传统基础设施未发生根本性变革。
- 今年3月与朋友去日本旅游,体验了大阪的繁华与武汉的美食。
- 在美国加州生活成本高,但湾区的风景非常美丽。
- 今年玩了较少的游戏,但重新体验了燕云十六声,感到惊喜。
- 珍惜平凡的日子,回忆起已故的猫,感慨普通生活的珍贵。