动态SUPERB第二阶段:一个协作扩展的基准,用于测量口语语言模型的能力,共包含180个任务
📝
内容提要
本研究解决了在开发通用口语语言模型过程中缺乏全面评估基准的问题。作者提出动态SUPERB第二阶段,这是一个开放的、不断扩展的基准,以全面评估基于指令的通用语音模型,并引入了180个任务,大幅度提升了评估能力。研究发现,目前的模型在任务处理上存在普遍不足,亟需进一步创新。
🏷️
标签
➡️