The DigitalOcean Blog ·

DigitalOcean 无服务器推理：深入探讨

💡 原文英文，约2800词，阅读约需11分钟。

📝

内容提要

DigitalOcean推出了无服务器推理平台，支持多种AI模型的管理和调用。该平台通过单一API密钥自动处理GPU资源分配和请求扩展，简化多模型应用的开发，支持文本、图像、视频等多种类型的推理，降低成本并提高效率。

🎯

🔎

DigitalOcean的无服务器推理平台通过自动处理GPU资源分配和请求扩展，显著降低了开发和维护多模型应用的复杂性。用户只需关注模型的调用，而不必担心基础设施的管理，这对于希望快速迭代和扩展AI应用的团队尤为重要。

该平台支持多种输入格式和模型类型，包括文本、图像和视频生成，用户可以通过单一API密钥访问30多个基础模型。这种灵活性使得开发者能够根据具体需求选择最合适的模型，优化成本和性能。

无服务器推理平台采用按令牌计费的模式，用户只需为实际使用的资源付费，而不是预留的GPU小时费用。这种计费方式降低了使用成本，尤其适合流量波动较大的应用场景，用户可以更好地控制预算。

❓

该平台支持文本、代码、视觉、图像生成、视频生成和语音等多种类型的AI模型。

平台通过单一API密钥自动处理GPU资源分配和请求扩展，简化了多模型应用的开发。

用户只需支付实际使用的令牌费用，而不是预留的GPU小时费用，从而降低了使用成本。

平台包括自动多模型路由、知识检索工具、提示缓存等功能，以提高推理效率和降低成本。

通过推理路由器，平台能够根据请求选择最佳模型，优化成本和速度。

每个请求都经过身份验证，并且会根据模型访问密钥进行请求验证，以确保安全性。

🏷️