量子位 ·

2.4万亿参数原生全模态，文心5.0一手实测来了

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

文心5.0正式发布，支持文字、图像、音频和视频的全模态输入与输出，具备强大的理解与生成能力。其在多模态理解和情感分析方面表现突出，能够精准捕捉细节并进行复杂推理。新技术采用统一架构，提升训练与推理效率，参数规模超过2.4万亿，标志着百度在大模型领域的突破。

🎯

关键要点

文心5.0正式发布，支持文字、图像、音频和视频的全模态输入与输出。
新技术采用统一架构，提升训练与推理效率，参数规模超过2.4万亿。
文心5.0在多模态理解和情感分析方面表现突出，能够精准捕捉细节并进行复杂推理。
支持全模态输入，用户可跨文件类别混合上传文档、图片、音频和视频。
文心5.0能够分析视频内容，识别情感和细节，表现出色。
引入超大规模混合专家架构，降低计算负载，提升模型性能。
文心5.0的能力延伸到智能体与工具调用的执行层，提升任务规划和决策执行能力。
百度在大模型领域持续迭代，推出文心5.0是其差异化突破的体现。

❓

延伸问答

文心5.0的主要功能是什么？

文心5.0支持文字、图像、音频和视频的全模态输入与输出，具备强大的理解与生成能力。

文心5.0的参数规模有多大？

文心5.0的参数规模超过2.4万亿。

文心5.0在多模态理解方面有什么优势？

文心5.0在多模态理解和情感分析方面表现突出，能够精准捕捉细节并进行复杂推理。

文心5.0如何处理视频内容？

文心5.0能够分析视频内容，识别情感和细节，甚至指出视频中的音乐与音频的关系。

文心5.0的训练架构有什么特点？

文心5.0采用统一架构进行训练，所有模态数据在同一套系统中联合学习，提升了效率和理解能力。

文心5.0的应用场景有哪些？

文心5.0可用于创意写作、指令遵循、智能体规划等多种场景，支持多模态内容的处理与生成。

🏷️

继续阅读

美国Meta收购Manus紧急叫停；百度发全员信通知职级体系大调整；华为曼谷发布会定档5月7日
美国Meta收购Manus被禁止，百度调整职级体系，华为将在曼谷发布新产品，微软与OpenAI修订合作协议，谷歌将在韩国建设AI园区，韩国股市超越英国成为全球第八大股市。
人类神话 – 我们已打开潘多拉的盒子
随着Anthropic Mythos等AI系统的出现，网络安全形势发生了重大变化。国家级攻击工具的普及使普通攻击者也能轻易利用漏洞。各国政府和企业需加快开...
将分散的知识转化为可信的智能：Stack Internal 2026.3
Stack Internal 2026.3版本推出了数据摄取功能，允许用户将分散内容转化为结构化知识，提升团队和AI工具的可靠性。该功能支持多种文件格式上...
瞧瞧这款令人惊叹的游戏笔记本电脑的皇冠明珠
华硕ROG Zephyrus Duo是一款售价5500美元的双屏游戏笔记本，配备两块16英寸OLED屏幕和顶级Nvidia RTX 5090显卡。尽管价格...
我们将代理支付协议捐赠给FIDO联盟，以支持安全的代理支付的未来。
为了推动代理技术的发展，谷歌将代理支付协议（AP2）捐赠给FIDO联盟，以促进行业创新。AP2 v.0.2版本引入了“人不在场”支付功能，允许代理根据用户...
A/B测试的陷阱：真实数据中有效与无效的实践
A/B测试的失败通常源于实验实践不当，而非产品创意问题。常见陷阱包括数据质量差、提前查看结果和错误的指标优化。解决方案包括进行数据卫生检查、使用序列测试、...