量子位 ·

超越OpenAI、拿下全球双料第一，“AI吴彦祖”背后大模型SOTA了！

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

MiniMax推出的Speech-02大模型在AI语音生成领域取得突破，获得全球权威评测第一，超越OpenAI等竞争对手。该模型支持多语言和个性化音色复刻，具备高效语音克隆能力，广泛应用于教育和智能硬件等领域，展现出强大的技术优势和市场潜力。

🎯

🔎

MiniMax的Speech-02模型通过引入可学习说话者编码器和Flow-VAE技术，显著提升了语音克隆的质量和效率。这种技术创新使得模型能够在极少样本的情况下，快速生成高保真度的语音，展现出强大的市场竞争力。

Speech-02不仅在教育领域展现出应用潜力，还在智能硬件、汽车智能座舱等新兴场景中获得了广泛应用。MiniMax与行业领军者的合作，推动了AI语音技术在多种场景中的落地，预示着未来更多创新应用的可能性。

MiniMax的Speech-02在性能上超越了OpenAI等竞争对手，同时其定价策略也极具竞争力，甚至低于ElevenLabs的价格。这种高性价比将吸引更多企业和开发者选择MiniMax的解决方案，进一步巩固其市场地位。

❓

Speech-02大模型具有超拟人、个性化和多样性三大特点，支持32种语言，能够实现高效的语音克隆和个性化音色复刻。

MiniMax的Speech-02在全球权威评测中获得第一，超越OpenAI等竞争对手，展现出强大的市场潜力。

Speech-02支持不同语言之间无缝切换，能够根据声音特征生成多种语言的语音，而无需参考文本。

MiniMax的技术优势在于其自回归Transformer架构和可学习说话者编码器，能够高效提取和保留说话者音色特色。

Speech-02在教育领域的应用包括与高途合作的AI语言陪练系统，以及吴彦祖英语课中的AI阿祖。

MiniMax通过与不同行业的合作，探索AI语音在教育、有声书、智能硬件等多个领域的应用，推动技术创新和商业价值。

🏷️