本研究探讨了多语言大语言模型在不同语言和任务中的提示翻译策略,评估了翻译质量和预训练数据规模对模型性能的影响,为选择最佳翻译策略提供了实用指南。
本研究推出了BanStereoSet数据集,用于评估多语言大语言模型中孟加拉语刻板社会偏见。通过本地化现有的数据集,填补了孟加拉语资源的空白,发现了不同社会类别中的显著偏见,推动了更公平语言技术的开发。
完成下面两步后,将自动完成登录并继续当前操作。