小红花·文摘

本研究提出了Audio-Reasoner，一个大型音频语言模型，旨在提升音频推理能力。通过构建包含120万个样本的高质量推理数据集CoTA，显著提高了音频推理的逻辑能力，并在多个基准测试中表现优异。研究强调了结构化链式思维训练的重要性。