TASER是一种利用大型推理模型进行自动翻译质量评估的指标,展示了在WMT24指标共享任务中的优越性能,尤其在非参考方法中排名第一。研究表明,结构化提示模板在LRMs中效果更佳,提升了可解释性和透明度,推动了翻译质量评估的进步。
本研究探讨了文学风格对话中性别解析的困难以及性别刻板印象的影响。作者提出通过外部元上下文中的角色和说话方式的信息来增强对话中的性别一致性,发现这些外部信息显著影响了对话中的指称性别的匹配。该研究可能推动更好的人机对话系统的发展,尤其是在处理性别相关任务时。
本文介绍了IKUN和IKUN-C系统在WMT24通用机器翻译任务中的应用,通过预训练和微调的方法提高多语言翻译效果。IKUN-C在约束系统中表现出色,对多语言翻译的提升具有重要影响。
研究评估了两个最先进的大型语言模型与传统神经机器翻译系统在法律领域的机器翻译质量,结果显示语言模型在翻译方面略优或相当,强调了其在专业领域的进化能力,并呼吁重新评估传统的评估方法。
完成下面两步后,将自动完成登录并继续当前操作。