李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

李沐回到上交大做演讲,分享了LLM趋势和个人职业选择,强调LLM的构成包括数据、算力和算法。他详细讲解了大模型的应用和挑战,分享了自己的职业经历和心得,鼓励学生们从动机出发去解决问题。

🎯

关键要点

  • 李沐回到上交大演讲,分享LLM趋势和个人职业选择。

  • LLM的构成包括数据、算力和算法,数据是寻找材料的过程。

  • 算力和带宽是LLM硬件的关键难点,内存限制模型大小。

  • 李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大。

  • 多模态是当前趋势,语言模型表现较好,视频模型仍较弱。

  • 大模型应用可以为用户提供无限人力资源,数据足够时可实现自动化。

  • 李沐分享了个人职业经历,强调不同阶段的基本目标。

  • 从动机出发解决问题,有学术价值、商业价值和成长价值的选择。

  • 李沐的创业经历和对大模型的看法引发了学生们的热烈反响。

延伸问答

李沐在演讲中分享了哪些关于LLM的趋势?

李沐分享了LLM的构成,包括数据、算力和算法,并强调了多模态是当前趋势。

李沐如何看待大模型的训练成本?

李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大,未来的训练成本将显著降低。

李沐在演讲中提到的职业选择有哪些?

李沐提到在大公司要考虑升职加薪,博士阶段关注毕业,创业时则要考虑如何退出。

李沐对大模型的应用有什么看法?

李沐认为大模型应用可以为用户提供无限人力资源,只要数据足够,就可以实现自动化。

李沐在演讲中提到的LLM硬件难点是什么?

李沐指出LLM硬件的关键难点是带宽和内存,尤其是在分布式训练中,带宽瓶颈尤为明显。

李沐的创业经历对学生有什么启示?

李沐鼓励学生从动机出发解决问题,强调学术、商业和成长价值的选择。

➡️

继续阅读