小红花·文摘

Qwen-Audio模型通过扩大音频语言预训练规模，覆盖30多项任务和各种音频类型，提升通用音频理解能力。它采用多任务训练框架，基于层次标签序列的条件设计，鼓励知识共享和避免干扰。Qwen-Audio在多个基准任务上表现出色，无需特定任务微调。同时，还介绍了Qwen-Audio-Chat，支持多轮对话和以音频为中心的场景。

MoWE-Audio：使用弱编码器的多任务音频大语言模型

BriefGPT - AI 论文速递 ·

Qwen-Audio模型通过扩大音频语言预训练规模，提高通用音频理解能力。多任务训练框架鼓励知识共享和避免干扰。Qwen-Audio在多个基准任务上表现出色，无需特定任务微调。Qwen-Audio-Chat支持多轮对话和以音频为中心的场景。

Qwen2-Audio 技术报告

BriefGPT - AI 论文速递 ·

本文介绍了Qwen-Audio预训练音频模型，通过扩大预训练规模和覆盖多项任务和音频类型，提高了通用音频理解能力。通过层次标签序列的条件设计，解决了多任务训练中的干扰问题。Qwen-Audio在多个基准任务上表现出色，无需特定任务的微调。作者还开发了Qwen-Audio-Chat，实现了多轮对话和音频为中心的场景支持。

Qwen2 技术报告

BriefGPT - AI 论文速递 ·