年龄组公平奖励:缓解大型语言模型中的偏见
📝
内容提要
本研究针对大型语言模型(LLMs)中存在的年龄偏见问题,提出了一种新的解决方案。通过构建年龄偏见偏好数据集和指令调优数据集,开发了年龄公平奖励(ARG),以改善不同年龄组之间的响应质量差异。实验结果显示,该方法显著提高了响应准确性,并减少了不同年龄组之间的性能差距。
🏷️
标签
➡️