AraTrust: 评估阿拉伯语 LLM 的可信度

提出了第一个全面的阿拉伯语语言模型信任度基准 ——AraTrust，其中包含了多个方面的真实性、伦理、安全性、身体健康、心理健康、不公正、非法活动、隐私和冒犯性语言的 516 道人工多项选择题。通过引入 AraTrust，旨在促进共同努力，为阿拉伯用户创造更安全、更值得信赖的语言模型，其中 GPT-4 在阿拉伯语方面表现出最高的可信度。

本研究探讨了大规模语言模型在印度法律任务中的能力，并提出了新的度量标准$LSS_{eta}$来评估模型的公平性和准确性。通过考虑模型在二元法定推理任务和印度社会不平等因素上的表现，评估了LLMs的安全性。同时，提出了利用专门的法律数据集进行微调流程的方法，以提高模型的安全性和可用性。

llm 公平性准确性印度法律任务大规模语言模型安全性