应对合成语音的挑战与机遇
原文英文,约1500词,阅读约需6分钟。发表于: 。We’re sharing lessons from a small scale preview of Voice Engine, a model for creating custom voices.
OpenAI发布了名为Voice Engine的模型的初步见解和结果。该模型使用文本输入和15秒的音频样本生成与原始说话者非常相似的自然语音。OpenAI对广泛发布持谨慎态度,因为合成语音的滥用可能性。他们希望就负责任的部署展开对话,并探讨社会如何适应这些新能力。Voice Engine的早期应用包括提供阅读辅助、翻译内容、触达全球社区、支持非语言人士和帮助患者恢复语音。OpenAI致力于安全构建Voice Engine,并已实施安全措施。他们认为,任何广泛部署的合成语音技术都应伴随着声音认证体验和保护个人声音的政策。OpenAI鼓励逐步淘汰基于声音的认证,教育公众AI技术,并加快开发追踪音频视觉内容来源的技术。他们致力于参与关于合成语音的挑战和机遇的对话。