机器之心 ·

提前免费！百度连发两款模型，我们实测：能听歌看电影，还会蛐蛐人

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

百度推出了文心 X1 和文心 4.5 两款新大模型，前者注重深度思考和多工具调用，后者擅长多模态理解和音视频分析。两款模型已上线并免费，文心 4.5 在多项性能测试中表现优于竞争对手。

🎯

🔎

文心 4.5 在多模态理解方面表现突出，能够处理音视频内容和梗图。这种能力使其在社交媒体和娱乐领域的应用潜力巨大，用户可以通过简单的音频或视频输入获取丰富的信息和分析。

文心 X1 和文心 4.5 的 API 价格相对较低，这可能会吸引更多开发者使用百度的服务，增强其在市场中的竞争力。随着大模型技术的普及，价格优势将成为吸引用户的重要因素。

文心 X1 和文心 4.5 采用了多项创新技术，如 FlashMask 和多模态异构专家扩展技术，这些技术显著提升了模型的训练效率和性能。用户在选择大模型时，应关注这些技术如何影响实际应用效果。

❓

文心 X1 注重深度思考和多工具调用，而文心 4.5 擅长多模态理解和音视频分析。

文心 4.5 能够理解音视频内容，并能识别梗图，表现出更强的多模态理解能力。

文心 X1 具备显著提升的逻辑推理能力，能够理解复杂问题并进行推理。

文心 4.5 的输入价格为 0.004 元/千 tokens，输出价格为 0.016 元/千 tokens；文心 X1 的输入价格为 0.002 元/千 tokens，输出价格为 0.008 元/千 tokens。

文心 4.5 能够识别音频并提供歌曲信息，还能分析视频内容，提取相关信息。

百度在 RAG 技术上具备中文深度理解、多模态检索和实时数据整合能力，提升了生成答案的准确性和时效性。

🏷️