The Cloudflare Blog ·

驱动代理：Workers AI现已支持大型模型，首个为Kimi K2.5

💡 原文英文，约2000词，阅读约需7分钟。

📝

内容提要

Cloudflare推出Workers AI，支持Kimi K2.5模型，具备256k上下文窗口，优化代理构建与执行，降低成本。新功能包括前缀缓存和异步API，提升性能与效率，便于开发者使用。

🎯

❓

Workers AI目前支持Kimi K2.5模型，具备256k上下文窗口。

Kimi K2.5模型具有高推理能力和大上下文窗口，适用于多种代理任务。

通过优化代理构建与执行，Workers AI使得使用Kimi K2.5模型的代理在安全审查中节省了77%的成本。

前缀缓存技术可以缓存之前请求的输入张量，从而减少预填充阶段的计算时间，提高吞吐量。

新异步API允许批量推理，避免容量错误，适用于非实时用例，确保请求能够在有空余时执行。

开发者可以通过Workers AI的文档获取Kimi K2.5模型的使用信息，并通过API进行调用。

🏷️

麻省理工学院研究人员教AI模型解读图表
MIT和IBM研究人员开发了ChartNet数据集，包含超过一百万种多样化图表，旨在提升视觉语言模型对图表的理解能力。该数据集通过合成数据生成，帮助小型企...
微软押注企业AI竞赛将依赖数据上下文而非模型能力
微软在Build 2026开发者大会上推出了Microsoft Fabric，旨在解决企业AI中的数据上下文问题。新平台包括HorizonDB数据库、GP...
GitHub如何计划重新赢回开发者
GitHub近期频繁出现故障，影响搜索和CI/CD管道。为应对增长，GitHub正在迁移至微软Azure云，重构系统以提升性能，目标是处理比目前多30倍的...
微软的Project Solara是一个用于AI代理设备的操作系统
微软在2026年Build大会上发布了基于Android的AI代理设备新操作系统“Project Solara”，展示了两个概念设备：一个类似于Amazo...
构建自己的AI代理
我们在freeCodeCamp.org的YouTube频道发布了一门课程，教授如何构建和部署智能AI代理，连接大型语言模型与现实世界自动化。课程由Ania...
微软发布Surface RTX SPARK开发工作站利用英伟达芯片提供本地AI算力
微软推出了 Microsoft Surface RTX SPARK 开发工作站，搭载英伟达芯片，支持本地运行 AI 模型。该工作站配备 20 核心 CPU...