利用自动度量模型化用户偏好:为机器翻译创建高质量偏好数据集
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文介绍了一种新方法,通过结合人工评估和自动度量,降低机器翻译中获取和评估人类偏好的成本。通过语言学家评估翻译质量,创建了包含18,000个实例的数据集MT-Pref。研究表明,在MT-Pref上进行模型对齐显著提升了WMT23和FLORES基准的翻译质量。
🎯
关键要点
- 提出了一种新方法,结合人工评估和自动度量,降低机器翻译中获取和评估人类偏好的成本。
- 通过语言学家评估翻译质量,创建了包含18,000个实例的数据集MT-Pref。
- 研究表明,在MT-Pref上进行模型对齐显著提升了WMT23和FLORES基准的翻译质量。
➡️