本研究针对大型语言模型在波斯语文化适应性评估的不足,提出了PerCul数据集,通过故事驱动的多项选择题提升文化敏感性。实验结果显示,现有模型与用户基准之间的差距为11.3%,最佳模型的差距达到21.3%。
本研究提出了新的基准SafeWorld,以解决大型语言模型在不同文化和法律标准下的安全性评估问题。结果表明,现有模型在文化敏感性和法律合规性方面存在困难,而SafeWorldLM表现优异,显示其在全球安全标准对齐中的潜力。
本研究提出CASA基准,以评估大型语言模型在在线购物和社交讨论中的文化敏感性。结果表明,现有模型的文化意识覆盖率不足10%,需通过提示和微调方法提升其文化适应能力。
该论文讨论了神经机器翻译系统中的伦理挑战,包括公平性、文化敏感性、数据处理、隐私、数据所有权和同意等问题。强调了人类监督在维护伦理标准方面的重要性,以及开发者对社会后果的责任。
本文介绍了一种利用赫尔辛基变压器在自我抓取的纯文学阿拉伯语数据集上进行微调的先进英 - 阿拉伯语翻译器。该翻译器在文化敏感性和语境准确性方面表现出色,优于谷歌翻译。研究强调了赫尔辛基变压器在使用文学阿拉伯语数据集时在英 - 阿语翻译方面的优越性。
完成下面两步后,将自动完成登录并继续当前操作。