研究表明,大型语言模型(LLMs)在提示适应过程中存在偏见转移现象。尽管有多种去偏策略,但未能有效减少偏见传播。性别、年龄和宗教等偏见在不同任务和人群中高度相关,表明纠正模型中的偏见有助于防止其在后续任务中的传播。
本研究评估了大语言模型推荐系统中的社会偏见问题,提出了FaiRLLM评估标准和指标。通过对ChatGPT的评估,发现其在推荐时对某些敏感属性存在不公平性。研究回顾了公平性相关文献,探讨了偏见评估方法和去偏策略,强调个性化因素的重要性,以促进人工智能的公平发展。
本文探讨了大型语言模型(LLMs)中的社会偏见及其对公众舆论预测的影响。研究发现,LLMs在性别和种族方面存在偏见,并提出了一种去偏策略,通过模拟社会接触显著减少了模型的偏见。此外,LLMs在多语言环境中的情感分析表现不一,强调了提升其文化适应性的必要性。
这篇论文探讨了大型视觉-语言模型(LVLMs)中的幻觉问题,提出了评估框架和无需训练的残差视觉解码方法,以减少幻觉现象。研究表明,开源 LVLMs 性能下降,通过引入更详细的视觉注释和新评估基准 RAH-Bench 提高模型准确性。此外,提出的去偏策略有效减轻了偏见,增强了生成内容的真实性。
本文介绍了BiasBuster框架,旨在识别和减轻大型语言模型中的认知偏见。研究开发了包含16,800个提示的数据集,测试了多种去偏策略,并提出了一种自助去偏方法。评估19个主要模型后发现,它们在金融合理性方面存在不同程度的非理性,强调了大型语言模型在金融应用中的优势与弱点,以及人类认知偏见对模型的影响。
本文介绍了BiasBuster框架,旨在识别和减轻大型语言模型中的认知偏见。通过开发包含16,800个提示的数据集,测试了多种去偏策略,验证了自助去偏方法的有效性。研究揭示了性别偏见的存在,并提出了无需访问模型参数的去偏方法。文章还回顾了大型语言模型中的公平性研究,探讨了评估指标和干预方法,强调了未来研究的必要性。
完成下面两步后,将自动完成登录并继续当前操作。