小红花·文摘

大型语言模型（LLMs）存在性别刻板印象和偏见，研究表明即使没有显性性别提及，模型仍表现出偏见。提出了新的检测和缓解偏见的方法，包括条件生成和多角色情境。实验显示，改进的自我反思机制能提高模型识别偏见的能力，推动更公平的人工智能系统发展。

面向多智能体大语言模型互动中的隐性偏见检测与缓解

BriefGPT - AI 论文速递 ·

本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题，发现大型语言模型（如BERT）在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架，强调需解决模型偏见，以确保医疗结果的公平性和准确性。同时，开发了BiasMedQA基准测试，评估模型在医学任务中的偏见影响，并呼吁对训练数据进行透明检查及提出偏见缓解策略。

朝着更公平的健康推荐：通过词义消歧找到信息丰富且无偏的样本

BriefGPT - AI 论文速递 ·