The Cloudflare Blog ·

Workers AI平台现已提供最先进的Leonardo图像生成模型和Deepgram文本转语音模型

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

Cloudflare的Workers AI平台新增与Leonardo.Ai和Deepgram的合作模型，支持低延迟图像生成和实时语音代理，提升开发者构建AI应用的能力。

🎯

🔎

Cloudflare的Workers AI平台专为低延迟应用设计，结合Leonardo和Deepgram的模型，开发者可以快速构建实时图像生成和语音代理应用。这种低延迟特性使得用户体验更加流畅，尤其在需要即时反馈的场景中，如在线游戏和语音助手。

通过Workers AI，开发者不仅可以使用图像和语音模型，还能利用Cloudflare的其他开发工具，如R2存储和WebSocket支持，构建完整的音频处理管道。这种整合能力为开发者提供了更大的灵活性和效率，适合多种应用场景。

Leonardo的Phoenix和Lucid Origin模型各有侧重，前者适合文本渲染，后者则擅长生成真实感图像。开发者在选择模型时，应根据具体需求和应用场景进行评估，以最大化利用这些先进技术的优势。

❓

Workers AI平台新增了与Leonardo.Ai的Phoenix和Lucid Origin图像生成模型，以及Deepgram的Nova-3语音转文本和Aura-1文本转语音模型。

Phoenix模型擅长文本渲染和提示一致性，能够快速生成图像。

Nova-3模型是一个语音转文本模型，能够快速且高准确率地转录音频。

Workers AI平台的基础设施专为快速推理设计，适合低延迟图像生成和实时语音代理。

Aura-1模型是一个上下文感知的文本转语音模型，能够根据输入文本应用自然的节奏和表现力。

可以通过WebSocket保持与推理服务器的连接，实现双向输入输出，使用Nova-3模型时可通过特定的API调用进行。

🏷️