The Verge ·

OpenAI的语音克隆AI模型只需15秒样本即可运行

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

OpenAI推出了名为Voice Engine的文本转语音生成平台，可根据15秒语音片段创建合成语音。AI生成的语音可按命令用同一语言或其他语言朗读文本提示。OpenAI表示，这有助于为各行各业的良好使用提供指导。目前可使用该技术的公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。OpenAI还为音频剪辑添加了水印以追踪来源，并积极监控音频使用情况。

🎯

关键要点

OpenAI推出了名为Voice Engine的文本转语音生成平台，能够根据15秒语音片段创建合成语音。
AI生成的语音可以用同一语言或其他语言朗读文本提示。
该技术的使用公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。
OpenAI表示，这些小规模的部署有助于指导如何在各行业中良好使用Voice Engine。
Voice Engine于2022年底开始开发，已为文本转语音API和ChatGPT的朗读功能提供支持。
OpenAI的模型训练使用了混合的许可和公开可用数据，预计仅向约10个开发者提供该模型。
AI文本到音频生成技术正在不断发展，尽管大多数关注乐器或自然声音，语音生成的关注较少。
美国政府正在努力遏制AI语音技术的不当使用，FCC禁止使用AI语音的机器人电话。
OpenAI要求合作伙伴遵守使用政策，不得在未获得同意的情况下冒充他人或组织，并需获得原始说话者的明确同意。
OpenAI为音频剪辑添加了水印以追踪来源，并积极监控音频使用情况。

❓

延伸问答

OpenAI的Voice Engine是什么？

Voice Engine是OpenAI开发的文本转语音生成平台，可以根据15秒的语音片段创建合成语音。

Voice Engine可以用来做什么？

Voice Engine可以用同一语言或其他语言朗读文本提示，适用于教育和健康等多个行业。

哪些公司正在使用OpenAI的Voice Engine？

使用Voice Engine的公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。

OpenAI如何确保Voice Engine的合规使用？

OpenAI要求合作伙伴遵守使用政策，不得在未获得同意的情况下冒充他人，并需获得原始说话者的明确同意。

Voice Engine的开发背景是什么？

Voice Engine于2022年底开始开发，旨在为文本转语音API和ChatGPT的朗读功能提供支持。

美国政府对AI语音技术有哪些监管措施？

美国FCC禁止使用AI语音的机器人电话，以遏制AI语音技术的不当使用。

🏷️