💡 原文中文,约3000字,阅读约需7分钟。
📝

内容提要

亚马逊云科技推出的Amazon Nova 2 Sonic语音模型提升了语音交互的流畅性与智能性,支持多语言切换,优化了语音识别和对话机制,增强了多任务处理能力,适用于多种应用场景。

🎯

关键要点

  • 亚马逊云科技推出Amazon Nova 2 Sonic语音模型,提升语音交互流畅性与智能性。
  • 新模型支持多语言切换,优化语音识别和对话机制,增强多任务处理能力。
  • Amazon Nova 2 Sonic生成的语音表现力强,支持多种语言的男声与女声。
  • 模型在多个关键评估指标上表现优于其他主流对话式AI模型。
  • BFCL基准测试显示模型在函数调用方面的准确性与稳定性更高。
  • ComplexFuncBench测试体现模型在处理多步骤任务方面的能力。
  • 自动语音识别准确率提升,能够更精准处理字母数字混合输入和不同口音。
  • 新增支持葡萄牙语和印地语,单个语音角色可在同一对话中切换语言。
  • 可配置的语音活动检测灵敏度优化了对话中的轮流发言机制。
  • 跨模态支持功能允许用户在同一会话中自由切换文本与语音输入方式。
  • 新增异步工具调用功能,支持复杂多步骤任务的处理。
  • 支持直接集成多种电话服务商,简化电话端交互的技术需求。
  • 用户可通过Amazon Bedrock调用新模型,升级过程简单便捷。
➡️

继续阅读