PerCul: 基于故事的波斯语大型语言模型文化评估
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究针对大型语言模型在波斯语文化适应性评估的不足,提出了PerCul数据集,通过故事驱动的多项选择题提升文化敏感性。实验结果显示,现有模型与用户基准之间的差距为11.3%,最佳模型的差距达到21.3%。
🎯
关键要点
- 本研究针对大型语言模型在波斯语文化适应性评估的不足。
- 提出了PerCul数据集,通过故事驱动的多项选择题提升文化敏感性。
- 实验结果显示,现有模型与用户基准之间的差距为11.3%。
- 最佳模型的差距达到21.3%。
➡️