OpenAI的语音克隆AI模型只需15秒样本即可运行

OpenAI的语音克隆AI模型只需15秒样本即可运行

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

OpenAI推出了名为Voice Engine的文本转语音生成平台,可根据15秒语音片段创建合成语音。AI生成的语音可按命令用同一语言或其他语言朗读文本提示。OpenAI表示,这有助于为各行各业的良好使用提供指导。目前可使用该技术的公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。OpenAI还为音频剪辑添加了水印以追踪来源,并积极监控音频使用情况。

🎯

关键要点

  • OpenAI推出了名为Voice Engine的文本转语音生成平台,能够根据15秒语音片段创建合成语音。
  • AI生成的语音可以用同一语言或其他语言朗读文本提示。
  • 该技术的使用公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。
  • OpenAI表示,这些小规模的部署有助于指导如何在各行业中良好使用Voice Engine。
  • Voice Engine于2022年底开始开发,已为文本转语音API和ChatGPT的朗读功能提供支持。
  • OpenAI的模型训练使用了混合的许可和公开可用数据,预计仅向约10个开发者提供该模型。
  • AI文本到音频生成技术正在不断发展,尽管大多数关注乐器或自然声音,语音生成的关注较少。
  • 美国政府正在努力遏制AI语音技术的不当使用,FCC禁止使用AI语音的机器人电话。
  • OpenAI要求合作伙伴遵守使用政策,不得在未获得同意的情况下冒充他人或组织,并需获得原始说话者的明确同意。
  • OpenAI为音频剪辑添加了水印以追踪来源,并积极监控音频使用情况。
➡️

继续阅读