小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了大型语言模型中的偏见问题,提出了一种可扩展的基准框架,通过多任务方法检测社会文化维度的偏见,并利用大型语言模型进行自动评估。研究揭示了模型大小与安全性之间的权衡,为未来更公平的语言模型发展提供指导。

Benchmarking Adversarial Robustness to Bias in Large Language Models: Scalable Automated Assessment Using LLM as a Judge

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

本研究提出VerbDiff模型,旨在解决文本到图像扩散模型在生成交互图像时的偏见问题。该模型能够更好地捕捉语义,生成高质量图像,实验结果表明其在复杂交互处理上优于传统方法。

VerbDiff: A Text-Only Diffusion Model Enhancing Interaction Awareness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种新颖的因果奖励建模方法,旨在解决大型语言模型对齐中的偏见问题,并验证了其在合成和真实数据集上的有效性,从而提升模型的可靠性与公平性。

超越奖励黑客:针对大型语言模型对齐的因果奖励

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z
程序理解工具:WatChat 调试用户心理模型以解释复杂代码

WatChat系统通过自然语言交互帮助用户理解复杂程序,重点在于调试用户的心理模型,而非仅展示代码。研究表明,WatChat能显著提高用户对复杂程序的理解。虽然目前仅适用于小型程序,并依赖大型语言模型可能存在偏见,但其在人类认知方面的创新为程序理解提供了新方向,对学生和专业人士都有价值。

程序理解工具:WatChat 调试用户心理模型以解释复杂代码

DEV Community
DEV Community · 2024-10-03T09:16:02Z

生物特征验证系统的准确性差异引发了偏见问题。本文分析了现有指标的优点和限制,并引入了一种新的通用偏见评估度量指标。实验结果表明,该度量能够有效量化人口统计偏见。作者还讨论了指标在不同场景中的适用性,并提供了基于场景的指标建议。

基于联合分析的人本风险评估生物识别系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

大型语言模型在医疗应用中存在偏见,倾向于为白人群体投射更高费用和较长住院时间,并在高生存率医疗场景中表现乐观。未来研究需解决和减轻语言模型偏见问题,确保公平准确结果对所有患者。

朝着更公平的健康推荐:通过词义消歧找到信息丰富且无偏的样本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

人工智能(AI)模型在医疗、教育和就业等领域得到广泛应用,但存在潜在的偏见问题。研究人员和从业者致力于减少AI模型的偏见,通过对不同类型偏见的分类和存在偏见的案例的研究来确保AI系统的公平性。此外,还探讨了偏见模型对用户体验的影响和伦理问题。希望通过这份综述促进公平和负责任AI领域的讨论。

计算机视觉中的公平性和偏见缓解:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

AI生成的人脸对人类生活有积极影响,但滥用风险也存在。为了解决偏见问题,研究引入了AI-Face数据集,包含真实人脸、deepfake视频中的人脸和AI生成的人脸。通过该数据集进行公平性评估,提供有价值的见解和发现,推动未来公平设计AI人脸检测器。

迈向更公平的人脸识别数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

大型语言模型在医疗应用中存在偏见,倾向于为白人群体投射更高的费用和较长的住院时间,并在高生存率的医疗场景中表现乐观。未来研究需要解决和减轻语言模型的偏见问题,确保公平和准确的结果。

种子偏见:在线资料中种族和性别对疾病的大规模文本分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-08T00:00:00Z

本文提出了一种解决学习算法中偏见问题的排序方法,采用延迟策略梯度方法和公平度量的代价函数,能够处理包含偏差和噪声的数据,获得准确而公平的排序策略。

OptiGrad:基于梯度学习的公平高效价格弹性优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-16T00:00:00Z

人工智能系统在临床实践中有潜力革新,但需要解决偏见问题。调查了生物医学领域中应用的偏见处理方法,并讨论了优势和弱点。同时回顾了其他潜在方法。

手语人工智能研究中的系统偏见:聋人呼吁重新评估研究议程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

人工智能系统在临床实践中有潜力革新,但需要解决偏见问题。调查了生物医学领域中应用的偏见处理方法,并讨论了优势和弱点。同时回顾了其他潜在方法。

应对生物医学中人工智能公平性和偏见的最新方法调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

大型语言模型在医疗应用中存在偏见,倾向于为白人投射更高费用和住院时间,乐观对待高生存率场景。未来研究需解决偏见问题,确保公平准确结果。

揭示和量化大型语言模型在医学报告生成中的种族偏见

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-25T00:00:00Z
负责任人工智能的良好实践:促进采用负责任且值得信赖的人工智能系统

生成式人工智能的出现带来了变革和机会,但需要负责任地使用。负责任人工智能的良好实践包括建立多学科团队、教育培训、平衡能力和人类判断、减少偏见、提高透明度和可解释性、持续测试和评估、保护隐私、定义应用场景和保护知识产权。高管们需要采取措施以安全可信地利用人工智能,解决偏见问题,发挥潜力。

负责任人工智能的良好实践:促进采用负责任且值得信赖的人工智能系统

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-01-24T03:00:44Z

本研究提出了一种快速采用的文本到图像扩散模型,通过分布对齐损失和有偏直接微调,解决了职业提示中的性别、种族偏见。方法具有可扩展性,支持多样观点公平,对文本到图像生成人工智能的社会调整有所帮助。

公平文本到图像扩散通过公平映射

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

本文综述了视觉问答(VQA)领域的研究进展,重点讨论了VQA方法中存在的偏见问题以及评估指标和去偏见方法的发展。同时还分析了VQA中的视觉与语言预训练模型的稳健性,并探讨了未来研究的关键领域。

遥感视觉问答中的语言偏见诅咒:空间属性、语言多样性和明确评估的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z

通过使用Kialo创建的数据集,研究发现ChatGPT在争议性话题上的偏见问题有所改善,但仍存在对右倾意识形态的隐性倾向。Bing AI的信息来源更加中立。这些研究结果对其他类型的偏见和领域具有普遍适用性。

源信息披露对 AI 生成的信息评估的影响:一项双部分研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

该文研究了评估过程中的偏见问题,并将其建模为信息约束下的损失最小化问题的解决方案。通过真实数据集验证模型,并研究干预的效果。结果有助于理解评估过程中偏见的出现,并提供减轻偏见的工具。

评估流程中的偏见:基于优化的模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-26T00:00:00Z

该研究提出了广义对数调整(GLA)方法,有效解决了预训练中的偏见问题,对各种任务都有显著提高。

广义逻辑调整:在基础模型中消除标签偏差以校准微调模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z

本文研究了大型语言模型在文摘生成中的偏见问题,提出了一种生成具有精细控制的人口属性的输入文档的方法。研究发现,单一文档的内容选择似乎在很大程度上不受偏见的影响,但虚构现象显示出有偏见传播到生成的文摘中的证据。

总结(几乎)已死

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码