小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Cloudflare推出AI Gateway,提供统一的推理层,支持通过一个API访问70多个AI模型,简化模型切换和成本管理。新功能包括自动重试和故障转移,确保高可靠性和低延迟,适合构建智能代理。用户还可集成自定义模型,提升应用性能。

Cloudflare的AI平台:为智能代理设计的推理层

The Cloudflare Blog
The Cloudflare Blog · 2026-04-16T14:05:00Z
Gemini 3.1 Flash Lite现已上线AI Gateway

谷歌的Gemini 3.1 Flash Lite已在AI Gateway上推出,性能优于2.5版本,特别在翻译、数据提取和代码补全方面有显著提升。该模型适合高负载任务,使用时需在AI SDK中设置为google/gemini-3.1-flash-lite-preview。AI Gateway提供统一API,支持模型调用和性能优化。

Gemini 3.1 Flash Lite现已上线AI Gateway

Vercel News
Vercel News · 2026-03-03T13:00:00Z
gpt-oss-20b和gpt-oss-120b现已在Vercel AI Gateway中支持

OpenAI发布了gpt-oss-20b和gpt-oss-120b模型,用户可通过Vercel的AI Gateway访问,无需额外账户。AI Gateway提供统一API,支持性能优化和故障恢复,确保高可用性。用户可使用AI SDK v5进行模型调用,并享受内置监控和智能路由功能。

gpt-oss-20b和gpt-oss-120b现已在Vercel AI Gateway中支持

Vercel News
Vercel News · 2025-08-05T13:00:00Z
Cursor就定价模糊问题道歉 同时将按使用次数定价换成按使用量定价

人工智能助手Cursor因定价不明确和额外账单问题致歉,调整Cursor Pro订阅计费方式,由按使用次数改为按使用量。新增Auto模式,用户可无限使用,并提供20美元的高级模型调用额度,超出后按成本价计费。

Cursor就定价模糊问题道歉 同时将按使用次数定价换成按使用量定价

蓝点网
蓝点网 · 2025-07-05T07:26:50Z

本研究提出了一种基于现有质量估计指标的级联翻译系统延迟规则,能够将大型模型的调用减少30%至50%,同时保持性能,显著降低计算成本。

智能翻译,而非艰难翻译:具有质量感知延迟的级联翻译系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本文介绍了如何在腾讯云HAI服务器上部署DeepSeek-R1大模型并实现实时调用。用户需登录腾讯云购买HAI服务并选择按时计费。部署后,可通过ChatBotUI、CloudStudio和JupyterLab等工具进行操作,文中详细说明了使用Ollama命令和API进行模型调用,成功实现了本地和外网的API操作。

腾讯云HAI服务器上部署与调用DeepSeek-R1大模型的实战指南 - 努力的小雨

努力的小雨
努力的小雨 · 2025-02-05T09:18:00Z

本文介绍了无问芯穹的大模型服务平台,包括获取API Key的方法、平台接口隐藏调用方法、获取API Key的改进方案、当前资源使用限额、平台支持的模型和显卡、快速使用模型的方法等。文章还提到了一些关于模型调用和性能评测的建议。

无问芯穹 MaaS AI 平台公测免费试用笔记:二

苏洋博客
苏洋博客 · 2024-04-01T06:13:00Z

LLM-Eval是一种用于评估开放领域对话系统的多维自动评估方法,可以在单个模型调用中覆盖多个方面,并在各种基准数据集上表现出高效性和适应性。同时,该分析还强调了选择适当的LLM和解码策略以获得准确评估结果的重要性。

QualEval: 模型改进的定性评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z
llama-cpp-python快速上手

本文介绍了如何快速使用llama-cpp-python,包括环境搭建和API使用。首先,通过pip安装依赖,然后使用高级和低级API进行模型调用,并提供示例代码。最后,介绍了如何搭建与OpenAI接口兼容的服务器,以便用户自建对话接口。

llama-cpp-python快速上手

plus studio
plus studio · 2023-07-28T17:23:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码