大型语言模型(LLMs)存在性别刻板印象和偏见,研究表明即使没有显性性别提及,模型仍表现出偏见。提出了新的检测和缓解偏见的方法,包括条件生成和多角色情境。实验显示,改进的自我反思机制能提高模型识别偏见的能力,推动更公平的人工智能系统发展。
本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题,发现大型语言模型(如BERT)在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架,强调需解决模型偏见,以确保医疗结果的公平性和准确性。同时,开发了BiasMedQA基准测试,评估模型在医学任务中的偏见影响,并呼吁对训练数据进行透明检查及提出偏见缓解策略。
完成下面两步后,将自动完成登录并继续当前操作。