本研究提出了跨语言自动评估套件(CIA Suite)和评估模型Hercule,旨在解决多语言评估的不足。该方法利用英语参考答案为低资源语言的文本生成赋分,实验结果表明评估结果与人类判断高度一致,显示出重要的多语言评估潜力。
完成下面两步后,将自动完成登录并继续当前操作。