内容提要
OpenAI推出了名为Voice Engine的文本转语音生成平台,可根据15秒语音片段创建合成语音。AI生成的语音可按命令用同一语言或其他语言朗读文本提示。OpenAI表示,这有助于为各行各业的良好使用提供指导。目前可使用该技术的公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。OpenAI还为音频剪辑添加了水印以追踪来源,并积极监控音频使用情况。
关键要点
-
OpenAI推出了名为Voice Engine的文本转语音生成平台,能够根据15秒语音片段创建合成语音。
-
AI生成的语音可以用同一语言或其他语言朗读文本提示。
-
该技术的使用公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。
-
OpenAI表示,这些小规模的部署有助于指导如何在各行业中良好使用Voice Engine。
-
Voice Engine于2022年底开始开发,已为文本转语音API和ChatGPT的朗读功能提供支持。
-
OpenAI的模型训练使用了混合的许可和公开可用数据,预计仅向约10个开发者提供该模型。
-
AI文本到音频生成技术正在不断发展,尽管大多数关注乐器或自然声音,语音生成的关注较少。
-
美国政府正在努力遏制AI语音技术的不当使用,FCC禁止使用AI语音的机器人电话。
-
OpenAI要求合作伙伴遵守使用政策,不得在未获得同意的情况下冒充他人或组织,并需获得原始说话者的明确同意。
-
OpenAI为音频剪辑添加了水印以追踪来源,并积极监控音频使用情况。
延伸问答
OpenAI的Voice Engine是什么?
Voice Engine是OpenAI开发的文本转语音生成平台,可以根据15秒的语音片段创建合成语音。
Voice Engine可以用来做什么?
Voice Engine可以用同一语言或其他语言朗读文本提示,适用于教育和健康等多个行业。
哪些公司正在使用OpenAI的Voice Engine?
使用Voice Engine的公司包括Age of Learning、HeyGen、Dimagi、Livox和Lifespan。
OpenAI如何确保Voice Engine的合规使用?
OpenAI要求合作伙伴遵守使用政策,不得在未获得同意的情况下冒充他人,并需获得原始说话者的明确同意。
Voice Engine的开发背景是什么?
Voice Engine于2022年底开始开发,旨在为文本转语音API和ChatGPT的朗读功能提供支持。
美国政府对AI语音技术有哪些监管措施?
美国FCC禁止使用AI语音的机器人电话,以遏制AI语音技术的不当使用。