小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Nemotron 3 Ultra现已在AI Gateway上可用

Nvidia推出的Nemotron 3 Ultra现已在Vercel AI Gateway上可用。这是一种开放的混合专家推理模型,专为长时间运行的代理工作流设计,具有1M的上下文窗口,支持多轮代理工作流,吞吐量可达每秒350个标记,成本降低30%。使用时需在AI SDK中设置模型为nvidia/nemotron-3-ultra-550b-a55b。

Nemotron 3 Ultra现已在AI Gateway上可用

Vercel News
Vercel News · 2026-06-04T07:00:00Z
AI Gateway上的Grok Imagine Video 1.5

xAI发布了Grok Imagine Video 1.5模型,该模型能够根据输入图像生成同步音频的视频。新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。用户可通过AI SDK使用此模型,结合图像模型生成动画,AI Gateway提供统一API以便调用和管理。

AI Gateway上的Grok Imagine Video 1.5

Vercel News
Vercel News · 2026-06-03T00:00:00Z

A security researcher found that adding a trailing slash to AWS HTTP API paths bypassed Lambda authorizer authentication entirely, enabling unauthenticated wire transfers at a fintech. The root...

A Trailing Slash Bypassed AWS API Gateway Authorization

InfoQ
InfoQ · 2026-06-01T09:55:00Z
Qwen 3.7 Plus现已在AI Gateway上线

阿里巴巴的Qwen 3.7 Plus已在Vercel AI Gateway上线,该模型将视觉和语言整合为单一代理,支持图形和命令行操作、编码及生产力工作流程。用户可通过AI SDK访问该模型,AI Gateway提供统一API,支持模型调用、使用跟踪和性能优化。

Qwen 3.7 Plus现已在AI Gateway上线

Vercel News
Vercel News · 2026-06-01T07:00:00Z
MiniMax M3在AI Gateway上

MiniMax M3已在Vercel AI Gateway上线,具备1M-token上下文窗口和多模态功能,专注于软件工程、终端工具使用和多轮协作。用户可通过AI SDK使用M3,支持文本和图像输入,AI Gateway提供统一API,便于模型调用和性能优化。

MiniMax M3在AI Gateway上

Vercel News
Vercel News · 2026-05-31T07:00:00Z
AI Gateway上的Opus 4.8

Claude Opus 4.8已在Vercel AI Gateway上线,专为长时间执行和复杂编码任务设计。该模型能够更清晰地撰写文档、分析数据和制作演示。使用时需在AI SDK中设置为anthropic/claude-opus-4.8。AI Gateway提供统一API,支持跟踪、成本配置及性能优化。

AI Gateway上的Opus 4.8

Vercel News
Vercel News · 2026-05-28T07:00:00Z
AI Gateway上的团队范围提供商白名单

AI Gateway现支持团队范围的提供商白名单,团队可限制请求的提供商,确保流量仅路由至批准的提供商。白名单在网关层面执行,开发者无法绕过,只有团队所有者可修改,确保控制集中且可审计。新提供商默认禁用,适用于所有API格式,确保安全合规。

AI Gateway上的团队范围提供商白名单

Vercel News
Vercel News · 2026-05-28T00:00:00Z
从Ingress NGINX到Envoy Gateway的零停机迁移

随着Kubernetes网络向Gateway API演进,许多团队正在评估从Ingress NGINX迁移的策略。本文案例研究了在AWS上成功迁移到Envoy Gateway的过程,强调了实现零停机的重要性。通过加权DNS记录,团队确保了流量平稳过渡,避免了请求丢失。Gateway API 1.5的ListenerSet资源将进一步改善基础设施与应用之间的分离。

从Ingress NGINX到Envoy Gateway的零停机迁移

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-05-25T11:00:00Z
Qwen 3.7 Max现已在Vercel AI Gateway上线

阿里巴巴的Qwen 3.7 Max已在Vercel AI Gateway上线,具备编码、办公流程自动化和长时间自主执行能力。该模型在前端原型设计和复杂多文件工程方面有所提升,支持多代理协作,并能在长时间工具调用中保持连贯推理。使用时需在AI SDK中设置为alibaba/qwen-3.7-max。

Qwen 3.7 Max现已在Vercel AI Gateway上线

Vercel News
Vercel News · 2026-05-21T07:00:00Z

Meryem Arik discusses why modern engineering teams face "inference chaos" and how AI model gateways provide a critical control layer. She explains the balance between empowering decentralized...

Presentation: The AI Gateway: Scaling Centralized Inference Across Decentralized Teams

InfoQ
InfoQ · 2026-05-20T12:40:00Z
Grok Build 0.1现已在Vercel AI Gateway上线

Grok Build 0.1现已在Vercel AI Gateway上线,作为一个用于代理编码的beta模型,支持Grok Build CLI应用。使用时需在AI SDK中将模型设置为xai/grok-build-0.1。AI Gateway提供统一API,便于调用模型、跟踪使用情况和成本,并支持性能优化和自定义报告功能。

Grok Build 0.1现已在Vercel AI Gateway上线

Vercel News
Vercel News · 2026-05-20T07:00:00Z
Vercel AI Gateway 插件用于 WordPress

Vercel AI Gateway插件为WordPress网站提供访问40多个供应商的数百个模型的能力,用户只需一个API密钥即可管理多个供应商,支持文本、图像和视频生成。该插件与WordPress AI客户端兼容,简化了AI功能的集成和使用。

Vercel AI Gateway 插件用于 WordPress

Vercel News
Vercel News · 2026-05-20T00:00:00Z
通过Unity AI Gateway推出AI支出控制功能

Unity AI Gateway推出了AI支出控制功能,帮助组织监控和管理AI成本,避免超支。用户可以通过设置预算警报实时跟踪支出,确保各部门需求得到满足。该系统与现有的Databricks预算集成,提供全面的成本可视化和治理能力。

通过Unity AI Gateway推出AI支出控制功能

Databricks
Databricks · 2026-05-19T14:04:00Z
Unity AI Gateway的新功能:AI代理和MCP的服务政策、安全防护、可观察性和成本控制

Unity AI Gateway是一个新的AI治理平台,旨在帮助组织控制AI代理的行为、成本和安全性。它提供实时政策管理、成本控制和全面可观察性,确保AI在生产环境中的安全和合规。新功能包括基于LLM的安全防护、成本跟踪和请求日志记录,帮助团队有效管理AI使用,防止成本失控。

Unity AI Gateway的新功能:AI代理和MCP的服务政策、安全防护、可观察性和成本控制

Databricks
Databricks · 2026-05-19T13:46:13Z
AI Gateway上的Gemini 3.5 Flash

Gemini 3.5 Flash已在Vercel AI Gateway上线,提升了编码能力和并行执行,特别在核心推理、指令遵循和多轮对话方面表现优异,适合复杂任务。使用时需在AI SDK中设置为google/gemini-3.5-flash,AI Gateway提供统一API,支持模型调用、使用跟踪和性能优化。

AI Gateway上的Gemini 3.5 Flash

Vercel News
Vercel News · 2026-05-19T07:00:00Z
在AI Gateway上按成本、延迟或吞吐量对提供者进行排序

AI Gateway 允许用户根据成本、首次令牌时间(TTFT)或吞吐量(TPS)对模型提供者进行排序,以优化请求,选择最低成本或最低延迟的提供者。排序在请求时计算,并支持与其他路由选项结合使用,确保高效处理。

在AI Gateway上按成本、延迟或吞吐量对提供者进行排序

Vercel News
Vercel News · 2026-05-15T00:00:00Z
Opus 4.7的快速模式现已在AI Gateway上推出

Claude Opus 4.7的快速模式现已在AI Gateway上推出,输出速度提高约2.5倍。此功能为实验性,使用时需设置相关选项,定价为标准Opus的6倍。

Opus 4.7的快速模式现已在AI Gateway上推出

Vercel News
Vercel News · 2026-05-12T08:00:00Z
AI Gateway上的Grok 4.3

Grok 4.3已在Vercel AI Gateway上线,知识截止至2025年12月,具备100万标记的上下文窗口。该模型在准确性、工具调用和指令执行方面有所提升。使用时需在AI SDK中设置为xai/grok-4.3,AI Gateway提供统一API,支持模型调用、使用跟踪和性能优化。

AI Gateway上的Grok 4.3

Vercel News
Vercel News · 2026-04-30T07:00:00Z
如何使用Scikit-Learn、AWS Lambda和API Gateway部署无服务器垃圾邮件分类器

在数字时代,垃圾邮件成为安全威胁。开发者利用机器学习构建智能过滤器,本文介绍了一个无服务器垃圾邮件分类器项目,结合Scikit-learn和AWS服务,实现实时消息分类。该系统模块化且成本效益高,支持独立更新模型,展示了机器学习实验与实际应用之间的桥梁。

如何使用Scikit-Learn、AWS Lambda和API Gateway部署无服务器垃圾邮件分类器

freeCodeCamp.org
freeCodeCamp.org · 2026-04-30T05:06:15Z
OpenAI GPT-5.5 现已在 Databricks 上可用,通过 Unity AI Gateway 完全管理

Databricks现已支持OpenAI的GPT-5.5,企业用户可以利用其增强的编码工作流和智能数据管道。通过Unity AI Gateway,用户能够安全地使用自然语言与复杂数据互动,构建定制化的智能代理,自动化文档处理流程。GPT-5.5提升了文档解析和推理能力,适用于多种云平台。

OpenAI GPT-5.5 现已在 Databricks 上可用,通过 Unity AI Gateway 完全管理

Databricks
Databricks · 2026-04-24T22:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码