dotNET跨平台 ·

AI Infra Brief｜多模态模型轻量化与算力军备竞赛（2026.02.08）

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

预计到2026年，AI算力支出将达到6350-6650亿美元。传统芯片厂商如博通和英特尔通过定制芯片与英伟达竞争。同时，Z.ai和OpenBMB等公司推出新模型，推动多模态模型的轻量化和AI应用的落地。

🎯

关键要点

预计到2026年，AI算力支出将达到6350-6650亿美元。
博通通过定制AI芯片挑战英伟达的市场地位。
英特尔挖角前AMD首席GPU架构师，计划在2027年抢占数据中心GPU市场。
Z.ai发布了GLM-OCR 0.9B轻量级OCR模型。
OpenBMB推出了MiniCPM-o 4.5实时多模态模型。
Sarvam AI发布支持印度22种语言的文档理解模型。
Holy Grail AI System自主开发的Agent PoC上线。
Termiteam v1.0.0发布，用于管理多个AI Agent终端的控制中心。
Vishal Sikka倡导通过'验证为中心的设计'确保LLM在关键场景下的可靠性。
社区探讨链上记忆/推理等方向以支持24/7 Agent运营。
多模态模型轻量化与算力军备竞赛白热化，降低部署门槛，加速边缘场景落地。

❓

延伸问答

预计到2026年，AI算力支出将达到多少？

预计到2026年，AI算力支出将达到6350-6650亿美元。

博通在AI芯片市场的策略是什么？

博通通过定制AI芯片挑战英伟达的市场地位，预计下季度收入翻倍。

英特尔在数据中心GPU市场的计划是什么？

英特尔计划在2027年推出AI芯片系列，目标是抢占500亿美元的数据中心GPU市场。

Z.ai发布了什么新模型？

Z.ai发布了GLM-OCR 0.9B轻量级OCR模型，用于从图像和PDF中提取文本、表格和公式。

OpenBMB推出了什么类型的模型？

OpenBMB推出了MiniCPM-o 4.5实时多模态模型，针对文本和图像的实时多模态任务进行了优化。

社区在AI领域探讨了哪些新方向？

社区探讨了链上记忆、推理、可验证计算、微支付和零费用共识等方向，以支持24/7 Agent运营。

🏷️

继续阅读

有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
史上最强游戏掌机来了！性能堪比 PS5，但……
今年掌机市场因元器件成本上涨而涨价，但英特尔等公司推出的新芯片提升了掌机性能和能效。微星和宏碁的新款掌机搭载英特尔 Arc G3 处理器，表现出色，续航能...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...
英特尔再次强调不会放弃Arc锐炫独立显卡英特尔也希望从游戏显卡里赚钱
英特尔重申不会放弃Arc锐炫独立显卡业务，仍看好移动和PC游戏市场。尽管市场占有率仅为0.28%，公司希望通过推出高性价比显卡吸引玩家。独立显卡仍是其产品...
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...
您的AI费用失控了。Cloudflare现在可以解决这个问题。
Cloudflare推出AI Gateway，帮助企业控制AI支出。新功能包括预算限制和身份驱动的支出管理，允许按用户、团队或模型设置预算。通过集中管理，...