小红花·文摘 - 小红花技术领袖俱乐部

消费级显卡可以快速上手跑！面壁智能MiniCPM-o 4.5发技术报告

量子位 ·

戴盟机器人发布全模态物理世界数据集Daimon-Infinity

戴盟机器人发布全模态物理世界数据集Daimon-Infinity

全球TMT-美通国际 ·

从Token到词元：全模态时代的基模与交互入口

量子位 ·

谜底揭晓：全网猜了一周的“DeepSeek V4”，竟是小米自研王牌

谜底揭晓：全网猜了一周的“DeepSeek V4”，竟是小米自研王牌

TechWeb 全站精华 ·

当多模态开始卷落地：MiniCPM-o-4.5仅9B覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5仅9B覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

HyperAI超神经 ·

文心5.0正式发布，参数达到2.4万亿，具备全模态能力，表现优异。其在文本和视觉理解方面多次夺冠，展现出强大的知识整合与创造力。通过原生全模态建模，提升了理解与生成的协同能力，已广泛应用于多个行业，未来发展值得关注。

2.4万亿参数“最强文科生”，文心5.0正式版，你挺懂山东人啊？

量子位 ·

文心大模型5.0正式版，上线！

文心大模型5.0正式版，上线！

百度大脑 ·

Uni-MoE-2.0-Omni：基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

Uni-MoE-2.0-Omni：基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

实时互动网 ·

美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench

美团技术团队 ·

文心5.0正式发布，支持文字、图像、音频和视频的全模态输入与输出，具备强大的理解与生成能力。其在多模态理解和情感分析方面表现突出，能够精准捕捉细节并进行复杂推理。新技术采用统一架构，提升训练与推理效率，参数规模超过2.4万亿，标志着百度在大模型领域的突破。

2.4万亿参数原生全模态，文心5.0一手实测来了

量子位 ·

阿里巴巴发布了开源全模态大模型Qwen2.5-Omni-7B，支持文本、音频、图像和视频的实时交互，性能优于同类模型。该模型轻量化，适合在手机等终端上部署，开发者可免费商用。

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

量子位 ·

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单，腾讯混元Research&清华&NTU联手打造

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单，腾讯混元Research&清华&NTU联手打造

机器之心 ·