李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

李沐回到上交大做演讲,分享了LLM趋势和个人职业选择,强调LLM的构成包括数据、算力和算法。他详细讲解了大模型的应用和挑战,分享了自己的职业经历和心得,鼓励学生们从动机出发去解决问题。

🎯

关键要点

  • 李沐回到上交大演讲,分享LLM趋势和个人职业选择。
  • LLM的构成包括数据、算力和算法,数据是寻找材料的过程。
  • 算力和带宽是LLM硬件的关键难点,内存限制模型大小。
  • 李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大。
  • 多模态是当前趋势,语言模型表现较好,视频模型仍较弱。
  • 大模型应用可以为用户提供无限人力资源,数据足够时可实现自动化。
  • 李沐分享了个人职业经历,强调不同阶段的基本目标。
  • 从动机出发解决问题,有学术价值、商业价值和成长价值的选择。
  • 李沐的创业经历和对大模型的看法引发了学生们的热烈反响。
➡️

继续阅读