小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨了多语言大语言模型在不同语言和任务中的提示翻译策略，评估了翻译质量和预训练数据规模对模型性能的影响，为选择最佳翻译策略提供了实用指南。

Beyond English: The Impact of Prompt Translation Strategies across Languages and Tasks in Multilingual Large Language Models

BriefGPT - AI 论文速递 ·

本研究推出了BanStereoSet数据集，用于评估多语言大语言模型中孟加拉语刻板社会偏见。通过本地化现有的数据集，填补了孟加拉语资源的空白，发现了不同社会类别中的显著偏见，推动了更公平语言技术的开发。

BanStereoSet: A Dataset for Measuring Stereotypical Social Biases in Bengali Large Language Models

BriefGPT - AI 论文速递 ·