实时互动网 ·

模型上新：阿里推出 Fun-ASR-Flash，从“听清楚”走向“听明白”

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

阿里推出的Fun-ASR-Flash语音识别模型支持三十种语言和十六种方言，准确率达到87.8%。该模型通过上下文和热词减少语义歧义，提升了对方言和小语种的识别能力，适用于复杂业务场景。

🎯

🔎

Fun-ASR-Flash在方言识别方面的表现显著提升，尤其在官话和吴语等方言上接近人工水平。这一进步不仅有助于提升用户体验，也为多元文化的交流提供了技术支持，尤其在中国这样方言众多的地区，能够有效减少沟通障碍。

随着全球化进程加快，小语种的识别能力变得愈发重要。Fun-ASR-Flash在东亚与东南亚的多语种场景中表现优异，尤其是在语料稀缺的情况下，能够保持稳定的识别准确率。这为国际业务和跨文化交流提供了更好的技术保障。

Fun-ASR-Flash通过引入上下文和热词，有效减少了语义歧义。这一能力在实际应用中尤为重要，尤其是在复杂对话场景中，能够更准确地理解说话者的意图，提升了语音识别的实用性和准确性。

❓

Fun-ASR-Flash支持三十种语言和十六种方言，覆盖八大方言区。

Fun-ASR-Flash的平均语义准确率达到87.8%。

在方言识别上，Fun-ASR-Flash的表现接近人工水平，特别是在官话方言上。

Fun-ASR-Flash通过结合上下文和热词来减少语义歧义，提高识别准确率。

Fun-ASR-Flash在小语种识别上表现优异，特别是在东亚与东南亚场景中。

该模型适用于会议纪要整理、实时字幕、教育录播和智能客服等场景。

🏷️