小红花·文摘

Qwen-Audio模型通过扩大音频语言预训练规模，覆盖30多项任务和各种音频类型，提升通用音频理解能力。它采用多任务训练框架，基于层次标签序列的条件设计，鼓励知识共享和避免干扰。Qwen-Audio在多个基准任务上表现出色，无需特定任务微调。同时，还介绍了Qwen-Audio-Chat，支持多轮对话和以音频为中心的场景。

MoWE-Audio：使用弱编码器的多任务音频大语言模型

BriefGPT - AI 论文速递 ·

Qwen-Audio模型通过扩大音频语言预训练规模，提高通用音频理解能力。多任务训练框架鼓励知识共享和避免干扰。Qwen-Audio在多个基准任务上表现出色，无需特定任务微调。Qwen-Audio-Chat支持多轮对话和以音频为中心的场景。

Qwen2-Audio 技术报告

BriefGPT - AI 论文速递 ·