小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
提示后的偏见:大型语言模型中的持续歧视

研究表明,大型语言模型(LLMs)在提示适应过程中存在偏见转移现象。尽管有多种去偏策略,但未能有效减少偏见传播。性别、年龄和宗教等偏见在不同任务和人群中高度相关,表明纠正模型中的偏见有助于防止其在后续任务中的传播。

提示后的偏见:大型语言模型中的持续歧视

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-25T00:00:00Z

本研究评估了大语言模型推荐系统中的社会偏见问题,提出了FaiRLLM评估标准和指标。通过对ChatGPT的评估,发现其在推荐时对某些敏感属性存在不公平性。研究回顾了公平性相关文献,探讨了偏见评估方法和去偏策略,强调个性化因素的重要性,以促进人工智能的公平发展。

挑战公平性:对基于大型语言模型的推荐中的偏见的全面探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本文探讨了大型语言模型(LLMs)中的社会偏见及其对公众舆论预测的影响。研究发现,LLMs在性别和种族方面存在偏见,并提出了一种去偏策略,通过模拟社会接触显著减少了模型的偏见。此外,LLMs在多语言环境中的情感分析表现不一,强调了提升其文化适应性的必要性。

社交情感是否内在于大型语言模型?关于不同群体情感提取的实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

这篇论文探讨了大型视觉-语言模型(LVLMs)中的幻觉问题,提出了评估框架和无需训练的残差视觉解码方法,以减少幻觉现象。研究表明,开源 LVLMs 性能下降,通过引入更详细的视觉注释和新评估基准 RAH-Bench 提高模型准确性。此外,提出的去偏策略有效减轻了偏见,增强了生成内容的真实性。

更加关注图像:一种无需训练的方法来减轻 LVLM 中的幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

本文介绍了BiasBuster框架,旨在识别和减轻大型语言模型中的认知偏见。研究开发了包含16,800个提示的数据集,测试了多种去偏策略,并提出了一种自助去偏方法。评估19个主要模型后发现,它们在金融合理性方面存在不同程度的非理性,强调了大型语言模型在金融应用中的优势与弱点,以及人类认知偏见对模型的影响。

在大型语言模型推理中平衡理性偏差和认知偏见:并非所有偏见均不好

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-16T00:00:00Z

本文介绍了BiasBuster框架,旨在识别和减轻大型语言模型中的认知偏见。通过开发包含16,800个提示的数据集,测试了多种去偏策略,验证了自助去偏方法的有效性。研究揭示了性别偏见的存在,并提出了无需访问模型参数的去偏方法。文章还回顾了大型语言模型中的公平性研究,探讨了评估指标和干预方法,强调了未来研究的必要性。

驾驭 LLMs 朝向无偏响应:一个因果引导的去偏框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码