IL-TUR:印度法律文本理解与推理基准

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

印度司法体系的法律文本大部分以复杂的英语编写,但只有约10%的印度人能读懂英语。本研究构建了第一个高质量的法律平行语料库,包含英语和九种印度语言的对齐文本单元。对该语料库上的机器翻译系统进行了性能评估,并通过调查法律从业人员了解他们对机器翻译系统的满意度。

🎯

关键要点

  • 印度司法体系的法律文本主要以复杂的英语编写,只有约10%的印度人能读懂英语。
  • 需要将法律文本翻译成各种印度语言,以便更多人能够理解。
  • 本研究构建了第一个高质量的法律平行语料库,包含英语和九种印度语言的对齐文本单元。
  • 研究评估了多种机器翻译系统的性能,包括商业、开源系统和大型语言模型。
  • 通过对法律从业人员的调查,了解他们对机器翻译系统的满意度,并比较了自动评估指标与从业人员意见的一致性。
➡️

继续阅读