2025 年终总结:当时只道是寻常

💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

由于创业,2025年过得很快,缺乏时间进行记录和反思。文章回顾了技术与生活,提到DeepSeek和vLLM的开发经历,讨论了AI基础设施的变化及个人旅行,强调珍惜平凡的日子。

🎯

关键要点

  • 由于创业,2025年过得很快,缺乏时间记录和反思。
  • 一月份DeepSeek的出现让我震撼,部署了小版本并发现vLLM对其支持不足。
  • 为vLLM提交了PR以支持DeepSeek的推理内容,经过社区审核后成功合并。
  • 尽管对模型推理市场前景不看好,但性能优化和系统设计的挑战依然吸引我。
  • 参与了基于LMCache和vLLM的可扩展推理服务的工作。
  • 实现了torch.distributed作为多节点推理的运行时,简化了分布式推理的复杂性。
  • Kubernetes的调度能力在AI基础设施中变得不可或缺。
  • 美国科技巨头在AI基础设施上的资本支出达到3000亿美元,显示出AI的战略重要性。
  • 大语言模型的预训练可能面临瓶颈,资本支出并不一定能直接反映技术进步。
  • Agent基础设施的需求尚不明确,传统基础设施未发生根本性变革。
  • 今年3月与朋友去日本旅游,体验了大阪的繁华与武汉的美食。
  • 在美国加州生活成本高,但湾区的风景非常美丽。
  • 今年玩了较少的游戏,但重新体验了燕云十六声,感到惊喜。
  • 珍惜平凡的日子,回忆起已故的猫,感慨普通生活的珍贵。