亚马逊AWS官方博客 ·

基于 Amazon Nova 实现优化呼叫中心导航场景

💡 原文中文，约7700字，阅读约需19分钟。

📝

内容提要

传统呼叫中心的按键导航复杂，影响用户体验。半开放式语音导航通过关键词匹配提升体验。本文探讨利用Amazon Bedrock和Nova模型进行关键词匹配，解决ASR准确性和发音差异等挑战，并介绍离线处理与在线推理方案。未来将关注Speech to Speech模型的应用。

🎯

🔎

传统呼叫中心的按键导航复杂，用户在多层级的菜单中容易迷失，导致体验不佳。半开放式语音导航通过关键词匹配简化了这一过程，提升了用户的互动体验。这种转变不仅提高了效率，也为用户提供了更直观的操作方式。

自动语音识别（ASR）技术在语音转文本过程中面临准确性挑战，尤其是在不同上下文和发音差异下。文章指出，传统方案依赖用户提供多种发音变体，这在实际应用中可能增加用户负担。因此，如何优化ASR的准确性是提升用户体验的关键。

文章提到未来将关注Speech to Speech模型的应用，这类模型有潜力在流畅度和准确性上超越现有的语音转文本技术。然而，考虑到其成本和延迟问题，企业在选择时需结合自身需求，谨慎评估是否采用这些新技术。

❓

传统呼叫中心的按键导航复杂，影响用户体验。

半开放式语音导航通过关键词匹配，用户只需说出关键词即可获得指引，从而提升体验。

Amazon Nova模型解决了ASR准确性和发音差异等挑战。

离线处理通过生成扩词词典，而在线推理则使用预生成词典或直接匹配用户输入。

评估包括短句关键词提取能力和基于语音相似度的关键词识别能力。

未来将关注Speech to Speech模型的应用和成本考虑。

🏷️