李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
💡
原文中文,约3500字,阅读约需9分钟。
📝
内容提要
李沐回到上交大做演讲,分享了LLM趋势和个人职业选择,强调LLM的构成包括数据、算力和算法。他详细讲解了大模型的应用和挑战,分享了自己的职业经历和心得,鼓励学生们从动机出发去解决问题。
🎯
关键要点
-
李沐回到上交大演讲,分享LLM趋势和个人职业选择。
-
LLM的构成包括数据、算力和算法,数据是寻找材料的过程。
-
算力和带宽是LLM硬件的关键难点,内存限制模型大小。
-
李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大。
-
多模态是当前趋势,语言模型表现较好,视频模型仍较弱。
-
大模型应用可以为用户提供无限人力资源,数据足够时可实现自动化。
-
李沐分享了个人职业经历,强调不同阶段的基本目标。
-
从动机出发解决问题,有学术价值、商业价值和成长价值的选择。
-
李沐的创业经历和对大模型的看法引发了学生们的热烈反响。
❓
延伸问答
李沐在演讲中分享了哪些关于LLM的趋势?
李沐分享了LLM的构成,包括数据、算力和算法,并强调了多模态是当前趋势。
李沐如何看待大模型的训练成本?
李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大,未来的训练成本将显著降低。
李沐在演讲中提到的职业选择有哪些?
李沐提到在大公司要考虑升职加薪,博士阶段关注毕业,创业时则要考虑如何退出。
李沐对大模型的应用有什么看法?
李沐认为大模型应用可以为用户提供无限人力资源,只要数据足够,就可以实现自动化。
李沐在演讲中提到的LLM硬件难点是什么?
李沐指出LLM硬件的关键难点是带宽和内存,尤其是在分布式训练中,带宽瓶颈尤为明显。
李沐的创业经历对学生有什么启示?
李沐鼓励学生从动机出发解决问题,强调学术、商业和成长价值的选择。
➡️