M-MAD：多维多智能体辩论框架用于细粒度机器翻译评估

本研究针对现有机器翻译评估方法的不足，提出了多维多智能体辩论框架（M-MAD），该框架通过将启发式MQM标准解耦为独立评估维度，实现了细粒度的评估。M-MAD利用多智能体辩论增强了大语言模型的协同推理能力，实验结果表明其评估性能不仅优于现有的LLM评判方法，还能与最新的基于参考的自动指标相媲美。

多智能体机器翻译