M-MAD:多维多智能体辩论框架用于细粒度机器翻译评估 本研究针对现有机器翻译评估方法的不足,提出了多维多智能体辩论框架(M-MAD),该框架通过将启发式MQM标准解耦为独立评估维度,实现了细粒度的评估。M-MAD利用多智能体辩论增强了大语言模型的协同推理能力,实验结果表明其评估性能不仅优于现有的LLM评判方法,还能与最新的基于参考的自动指标相媲美。 多智能体 机器翻译