量子位 ·

李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

李沐回到上交大做演讲，分享了LLM趋势和个人职业选择，强调LLM的构成包括数据、算力和算法。他详细讲解了大模型的应用和挑战，分享了自己的职业经历和心得，鼓励学生们从动机出发去解决问题。

🎯

关键要点

李沐回到上交大演讲，分享LLM趋势和个人职业选择。
LLM的构成包括数据、算力和算法，数据是寻找材料的过程。
算力和带宽是LLM硬件的关键难点，内存限制模型大小。
李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大。
多模态是当前趋势，语言模型表现较好，视频模型仍较弱。
大模型应用可以为用户提供无限人力资源，数据足够时可实现自动化。
李沐分享了个人职业经历，强调不同阶段的基本目标。
从动机出发解决问题，有学术价值、商业价值和成长价值的选择。
李沐的创业经历和对大模型的看法引发了学生们的热烈反响。

❓

延伸问答

李沐在演讲中分享了哪些关于LLM的趋势？

李沐分享了LLM的构成，包括数据、算力和算法，并强调了多模态是当前趋势。

李沐如何看待大模型的训练成本？

李沐认为模型训练每年会以2倍速度变得更便宜、更快、更大，未来的训练成本将显著降低。

李沐在演讲中提到的职业选择有哪些？

李沐提到在大公司要考虑升职加薪，博士阶段关注毕业，创业时则要考虑如何退出。

李沐对大模型的应用有什么看法？

李沐认为大模型应用可以为用户提供无限人力资源，只要数据足够，就可以实现自动化。

李沐在演讲中提到的LLM硬件难点是什么？

李沐指出LLM硬件的关键难点是带宽和内存，尤其是在分布式训练中，带宽瓶颈尤为明显。

李沐的创业经历对学生有什么启示？

李沐鼓励学生从动机出发解决问题，强调学术、商业和成长价值的选择。

🏷️

标签

LLM 上交大大模型李沐演讲职业选择

➡️

继续阅读

我在WAIC 2026看见的十大趋势
没有人因此热情减退
小红书大模型IMO满分夺金，第三题解法让冠军选手直呼优雅
中国大模型首次获得IMO官方金牌水平认证
Building multi-Region resiliency for AWS CloudFormation custom resource deployment
AWS CloudFormation is the foundational tool of infrastructure-as-code for tho...
GitHub Increased Instant Navigation from 4% to 22% by Rethinking Client Side Architecture
GitHub redesigned GitHub Issues navigation using a client-side architecture t...
Kaggle + Google’s Free 5-Day Agentic AI Course
Google and Kaggle's 5-Day AI agents course is now freely available to everyone.
Architecting offline-first generative AI applications for edge deployments using AWS services
According to Siemens’ 2024 report The True Cost of Downtime, Fortune 500 comp...