Vercel News ·

GLM 5.2 Fast现已通过Wafer在AI Gateway上线

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

GLM 5.2 Fast现已在AI Gateway上线，提供比其他服务商高2倍的吞吐量，适用于小、大上下文场景。使用时需在AI SDK中设置模型为zai/glm-5.2-fast。AI Gateway提供统一API，支持用量跟踪、成本管理及性能优化，无平台费用。

🎯

🔎

GLM 5.2 Fast在AI Gateway的吞吐量是其他服务商的两倍，尤其在小上下文和大上下文场景中表现突出。这意味着在处理大量请求时，用户可以获得更快的响应速度，适合需要高效数据处理的应用场景。

在使用GLM 5.2 Fast时，用户需在AI SDK中正确设置模型为zai/glm-5.2-fast。确保配置正确可以避免潜在的错误和性能问题，从而充分发挥该模型的优势。

AI Gateway提供的统一API支持用量跟踪和成本管理，用户可以通过内置的报告功能监控使用情况。这对于预算有限的项目尤为重要，能够帮助用户在控制成本的同时，优化性能。

❓

GLM 5.2 Fast的吞吐量比其他服务商高2倍，小上下文超过170个token/秒，大上下文超过200个token/秒。

在AI SDK中设置模型为zai/glm-5.2-fast即可使用GLM 5.2 Fast。

AI Gateway提供统一API、用量跟踪、成本管理、性能优化等功能，并支持自定义报告和预算管理。

使用GLM 5.2 Fast不收取平台费用，包括推理和自带密钥请求。

GLM 5.2 Fast适用于小上下文和大上下文场景。

AI Gateway反映服务商定价，无加价，并且不对推理收取平台费用。

🏷️