解道jdon.com 解道jdon.com -

OpenAI:可从15秒的音频中克隆出声音

OpenAI 刚刚宣布近期进行了小规模预演一个名为“语音引擎”的新工具的诞生。这是一种声音克隆技术,可以通过分析 15 秒的音频样本来模仿任何说话者。该公司表示,它可以生成“自然的语音”和“情感丰富且真实的声音”。这项技术基于该公司已有的文本到语音 API,自 2022 年起就在开发中。OpenAI 已经在使用该工具集的一个版本,为当前文本到语音 API 和朗读功能中的预设语音提供动力。在该公司的官方博客上有一些样本,听起来非常接近真实的声音。OpenAI 表示,他们认为这项技术可以用于阅读辅助、语言翻译,以及帮助那些患有突发性或退行性语言疾病的人。该公司提到了布朗大学的一个试点项目,该项目通

OpenAI宣布开发了声音克隆技术,可模仿任何说话者。该技术可用于阅读辅助、语言翻译和帮助语言障碍患者。然而,滥用可能导致深度伪造和隐私问题。OpenAI承诺采纳反馈意见以确保产品推出时风险最小,并采取安全措施来追踪音频来源和监控系统使用情况。

OpenAI 声音克隆技术 语言翻译 阅读辅助 隐私问题

相关推荐 去reddit讨论