OpenAI ·

应对合成语音的挑战与机遇

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

OpenAI展示了Voice Engine模型，该模型通过文本和15秒音频样本生成自然语音，尽管模型较小，但声音情感丰富。OpenAI在评估合成语音的潜在滥用后，计划与社会对话，探讨负责任的应用。

🎯

🔎

OpenAI的Voice Engine模型能够通过短短15秒的音频样本生成情感丰富的自然语音。这一特性使得合成语音在应用中更具人性化，能够更好地传达情感和语境，适用于教育、娱乐等多个领域。

尽管合成语音技术具有广泛的应用前景，但OpenAI对其潜在滥用表示谨慎。合成语音可能被用于虚假信息传播或身份冒用，因此在推广之前，进行社会对话和风险评估显得尤为重要。

OpenAI计划在小规模测试的基础上，决定是否大规模部署Voice Engine。这种谨慎的态度反映了对技术影响的深思熟虑，强调了在技术进步与社会责任之间找到平衡的重要性。

❓

Voice Engine模型通过文本和15秒音频样本生成自然语音，声音情感丰富，接近原始说话者的声音。

OpenAI对合成语音的潜在滥用持谨慎态度，计划与社会对话以探讨负责任的应用。

Voice Engine模型于2022年底首次开发。

OpenAI将基于与社会的对话和小规模测试结果，决定是否以及如何大规模部署该技术。

Voice Engine模型被用于文本转语音API，提供预设语音功能。

OpenAI希望通过对话探讨社会如何适应合成语音的新能力。

🏷️