The New Stack ·

OpenAI 实时 API 闪亮登场

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

OpenAI在旧金山的DevDay活动中推出了四个新版本的应用开发产品，重点是新的实时API公测版。该API支持开发者创建与AI聊天机器人的互动应用。新模型包括GPT-4o和GPT-o1，支持语音生成和自然语音对话。OpenAI计划增加视觉和视频功能，并提高API的会话限制。实时API现已开放给开发者测试。

🎯

关键要点

OpenAI在旧金山的DevDay活动中推出了四个新版本的应用开发产品，重点是新的实时API公测版。
实时API允许开发者构建与AI聊天机器人的互动应用。
新模型包括GPT-4o、GPT-4o mini、GPT-o1和GPT-o1 mini，支持语音生成和自然语音对话。
实时API支持低延迟的多模态功能，允许自然的语音对话。
OpenAI的首席产品官Kevin Weil分享了使用GenAI语音技术进行跨语言交流的实例。
开发者只需描述应用需求，GPT AI便能自动生成所需的语言模型。
Chat Completions API支持音频输入和输出，适用于不需要低延迟的场景。
开发者可以通过单个API调用构建自然对话体验，简化了开发流程。
实时API支持持久的WebSocket连接，能够处理用户请求并触发相应的操作。
OpenAI计划增加视觉和视频功能，并提高API的会话限制。
OpenAI正在与Healthify和Speak等用户进行公测，测试实时API的应用。
实时API现已向开发者开放公测，适用于使用Tiers 2至5的开发者。

❓

延伸问答

OpenAI的实时API有什么新功能？

实时API支持开发者构建与AI聊天机器人的互动应用，允许自然的语音对话，并支持低延迟的多模态功能。

开发者如何使用OpenAI的实时API？

开发者只需描述应用需求，GPT AI便能自动生成所需的语言模型，简化了开发流程。

实时API支持哪些模型？

实时API支持的模型包括GPT-4o、GPT-4o mini、GPT-o1和GPT-o1 mini。

OpenAI计划在实时API中增加哪些功能？

OpenAI计划增加视觉和视频功能，并提高API的会话限制。

实时API如何改善语音助手的体验？

实时API通过流式处理音频输入和输出，能够实现更自然的对话体验，减少情感和语调的损失。

哪些公司正在测试OpenAI的实时API？

Healthify和Speak等公司正在测试实时API，分别用于营养指导和语言学习应用。

🏷️