机器之心 ·

李沐重返母校上海交大，从LLM聊到个人生涯，这里是演讲全文

💡 原文中文，约14200字，阅读约需34分钟。

📝

内容提要

李沐在上海交大分享了关于语言模型和个人生涯的演讲，讲述了语言模型的算力、数据和算法三个方面，以及硬件、数据和算法未来的发展。他还提到了预训练和后训练的区别，以及垂直模型和评估的重要性。分享了自己的打工人、读博士和创业的经历，以及持续提升自己的方法。鼓励大家抓住当前技术带来的机会，付出更多努力。

🎯

关键要点

李沐在上海交大分享了关于语言模型和个人生涯的演讲。
语言模型的核心要素包括算力、数据和算法。
数据的获取是一个艰苦的过程，需要大量的材料。
算力和硬件的进步对模型的性能至关重要。
未来几年，算力、内存和带宽将会有显著的发展。
内存大小将限制模型的规模，而算力价格长期来看会逐渐降低。
语言模型的参数规模将主要集中在100B到500B之间。
语音模型的技术进步使得信息传递更丰富、延迟更低。
音乐生成的商业化面临版权问题，而图像生成技术已经取得显著进展。
多模态模型整合不同类型的信息，未来将通过文本指令控制生成。
AI在文科白领、工科白领和蓝领工作中的应用潜力不同。
李沐分享了自己在大公司、读博士和创业的经历，强调了不同阶段的目标和挑战。
创业需要强烈的动机和对复杂社会的理解。
持续提升自我的方法包括定期总结和反思个人目标。
当前是一个充满机会的时代，但需要付出更多努力才能获得成功。

❓

延伸问答

李沐在演讲中提到的语言模型的核心要素是什么？

语言模型的核心要素包括算力、数据和算法。

李沐如何看待未来算力和内存的发展？

未来几年，算力、内存和带宽将会有显著的发展，算力价格长期来看会逐渐降低。

李沐在演讲中分享了哪些个人经历？

李沐分享了自己在大公司、读博士和创业的经历，强调了不同阶段的目标和挑战。

李沐对创业的看法是什么？

李沐认为创业需要强烈的动机和对复杂社会的理解，同时也面临许多挑战。

李沐提到的持续提升自我的方法是什么？

李沐建议定期总结和反思个人目标，以持续提升自我。

李沐如何看待当前技术带来的机会？

李沐鼓励大家抓住当前技术带来的机会，付出更多努力以获得成功。

🏷️

继续阅读

使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
个人博客网站如何变现：不依赖广告联盟的几个思路
本文探讨了博客在没有AdSense的情况下实现盈利的方法，包括：1. 联盟营销；2. 直接卖广告位；3. 接付费评测；4. 销售自己的产品；5. 寻找Ad...
网络设备曾经看起来像小型笔记本电脑，但现在它们变得更加个性化
近年来，网络设备（cyberdecks）向个性化发展，许多DIY爱好者在社交媒体上展示将计算机组件隐藏在手袋、玩具等物品中的创意。这些迷你Linux计算机...
模型评估：证明您的路由策略确实有效
本文介绍了DigitalOcean的模型评估功能，帮助团队在真实工作负载下评估不同的推理策略。用户可以通过比较多种模型和路由策略来优化成本、延迟和输出质量...
PATH计划提升与行业对接的人工智能培训和职业机会
麻省理工学院与乔治亚州立大学合作推出PATH计划，旨在通过建立州级中心，连接大学、社区学院、行业和政府，提供与行业对接的人工智能培训。该计划强调实践学习，...
Cursor降低价格并增加企业支出控制，迎接“代币经济”变革
本周AI编码领域发生了重要变化，GitHub的Copilot结束固定订阅模式，转向基于使用量的计费，引发用户强烈反响。Linux基金会成立Tokenomi...