小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
CURD 程序员,该如何理解 AI 大模型中的多模态(Multimodal)?

多模态AI大模型(MLLM)通过处理文本、图像、音频和视频等信息,提升了AI的理解能力。主流模型如Gemini和文心5.0强调原生多模态训练,能够更好地理解复杂信息。多模态应用包括视觉问答、视频理解和医疗辅助,展现了AI从“只读文字”到“观察世界”的转变。

CURD 程序员,该如何理解 AI 大模型中的多模态(Multimodal)?

人言兑
人言兑 · 2026-04-24T00:03:06Z

文心5.0正式发布,参数达到2.4万亿,具备全模态能力,表现优异。其在文本和视觉理解方面多次夺冠,展现出强大的知识整合与创造力。通过原生全模态建模,提升了理解与生成的协同能力,已广泛应用于多个行业,未来发展值得关注。

2.4万亿参数“最强文科生”,文心5.0正式版,你挺懂山东人啊?

量子位
量子位 · 2026-01-23T13:43:57Z
文心大模型5.0正式版,上线!

百度文心大模型5.0正式上线,参数达到2.4万亿,具备全模态理解与生成能力,支持文本、图像、音频和视频等多种信息。该技术采用统一自回归架构,提升推理效率,显著增强多模理解、代码生成和创意写作能力。百度千帆平台已支持企业用户便捷调用文心5.0,助力各行业应用。

文心大模型5.0正式版,上线!

百度大脑
百度大脑 · 2026-01-22T12:51:18Z
千亿AI投入后,百度的估值逻辑发生了变化

百度在AI领域的投资已超过1000亿元,三季度AI业务收入增长超过50%。新发布的文心5.0模型具备强大的多模态能力,推动了数字人技术和在线营销服务的发展。百度正通过全栈自研重构业务,未来将实现更大收益。

千亿AI投入后,百度的估值逻辑发生了变化

TechWeb 全站精华
TechWeb 全站精华 · 2025-11-20T01:41:04Z

文心5.0正式发布,支持文字、图像、音频和视频的全模态输入与输出,具备强大的理解与生成能力。其在多模态理解和情感分析方面表现突出,能够精准捕捉细节并进行复杂推理。新技术采用统一架构,提升训练与推理效率,参数规模超过2.4万亿,标志着百度在大模型领域的突破。

2.4万亿参数原生全模态,文心5.0一手实测来了

量子位
量子位 · 2025-11-13T09:39:15Z
多家车企确认收到中国产安世半导体芯片;前DeepSeek研究员罗福莉加入小米;OpenAI发布GPT-5.1系列模型

多家车企确认获得中国产安世半导体芯片;罗福莉加入小米;百度发布文心5.0大模型;OpenAI推进GPT-5系列升级;Anthropic投资500亿美元建设AI基础设施;沃达康与星链合作提供非洲互联网服务。

多家车企确认收到中国产安世半导体芯片;前DeepSeek研究员罗福莉加入小米;OpenAI发布GPT-5.1系列模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-11-13T05:11:45Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码