小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
关于肥胖的杂谈

作者表达了对糖和油的厌恶,反映出对肥胖的恐惧。因抗癫痫药物影响,体重曾达到210斤,导致自卑。尽管减重后仍对体型敏感,强调健康饮食和锻炼。文章探讨了肥胖羞耻及社会偏见,呼吁理性看待肥胖与健康。

关于肥胖的杂谈

極客死亡計劃
極客死亡計劃 · 2025-08-28T14:16:00Z
通过核心指代解析中的信心差异研究大型语言模型中的交叉偏见

大型语言模型(LLMs)在招聘和招生等资源有限的环境中被广泛应用,但可能反映和加剧社会偏见。研究扩展了单轴公平评估,关注交叉偏见,创建了WinoIdentity基准,评估245,700个提示中的50种偏见模式。结果显示,LLMs在某些身份群体上的信心差异可达40%,尤其在反刻板印象的情境中,对双重弱势身份的信心最低。这表明LLMs的表现可能更多依赖于记忆而非逻辑推理。

通过核心指代解析中的信心差异研究大型语言模型中的交叉偏见

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-18T00:00:00Z
人工智能的人文视野

人工智能已深入生活各领域,影响个人选择与社会结果。我们需警惕技术依赖,建立透明且用户可控的系统,以应对隐私风险。同时,AI可能加剧社会偏见,需多方合作解决。有效治理应灵活应对技术变化,确保伦理与人类尊严。通过集体努力,我们能构建以人类价值为核心的AI未来。

人工智能的人文视野

DEV Community
DEV Community · 2025-05-23T23:00:00Z

本研究提出了一种新方法,通过识别嵌入空间中的语义方向向量,将文本嵌入限制在安全区域,以应对扩散模型生成不安全内容和社会偏见的问题。该方法增强了模型对潜在不安全提示的鲁棒性,并在多个基准数据集上显著减少了NSFW内容和社会偏见。

Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究探讨了维基数据知识表示中的社会偏见,特别是在链接预测任务中对少数群体的影响。提出的AuditLP框架利用公平性指标识别性别和年龄偏见,发现偏见结果与全球北方和南方的社会经济文化分区相关。

Social Biases in Knowledge Representations of Wikidata Separate Global North from Global South

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z
揭示人工智能中的偏见:FairCode基准用于代码生成

在人工智能影响日益加深的背景下,算法偏见问题备受关注。文章介绍了“FairCode基准”,旨在评估和减轻代码生成中的社会偏见。研究显示,性别和种族等因素导致的偏见影响招聘、教育和医疗等领域。通过FairScore指标,开发者可以量化模型表现,推动更公平的AI系统,确保技术惠及所有人。

揭示人工智能中的偏见:FairCode基准用于代码生成

DEV Community
DEV Community · 2025-01-11T08:08:54Z

本研究提出了FairCode基准,用于评估代码生成中的社会偏见。结果表明,所有测试的大型语言模型均存在偏见,强调了评估其社会偏见的重要性。

Fair Code: Assessing Social Bias in Code Generation of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一种局部反事实生成方法,旨在减少基础模型中的社会偏见。通过自动遮罩和引导修复,限制反事实修改在特定属性区域,保持图像上下文,提高性别反事实的视觉和语义保真度。这为创建平衡数据集提供了框架,以便进行准确的偏见分析和有效的缓解。

Pinpoint Counterfactuals: Reducing Social Bias in Foundation Models via Localized Counterfactual Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种扩展BBQ数据集的方法,以评估大型语言模型在开放情境中的社会偏见。结果显示,模型对特定特征(如年龄和社会经济地位)存在偏见,但通过结合零-shot、少量样本和思维链的方法,可以显著降低这些偏见。

Evaluating and Mitigating Social Biases of Large Language Models in Open Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种弯曲VLM方法,旨在解决视觉语言模型嵌入中的社会偏见问题。该方法无需微调,能够根据输入动态调整去偏见操作,从而提升灵活性和适用性。

Curved Vision-Language Models: Debiasing Visual-Language Embeddings at Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

近期大型语言模型(LLMs)在模拟人类行为方面展现潜力,但在政治辩论中存在局限性,尤其是反映固有社会偏见,导致行为偏离人类社会动态。研究强调需探索克服偏见的策略,以提升模拟的现实性。

隐藏的劝说者:大型语言模型的政治倾向及其对选民的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出了一种关注指令调优(FIT)方法,以解决大型语言模型在不同上下文中因伪特征和偏见特征引发的不良行为。实验结果表明,FIT方法提高了模型的鲁棒性,减少了社会偏见,并增强了在新环境中的表现。

关注这个,而不是那个!通过自适应特征规范调节大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

大型语言模型存在社会人口统计学偏见,尤其在中间层的潜在表示中更为明显。通过逻辑Bradley-Terry探测器验证的偏好配对任务显示,模型在多个类别中存在显著偏见。

注意力显示量级:定位和减轻语言模型中的偏见

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

近期大型语言模型(LLMs)在模拟人类行为方面展现潜力,但在政治辩论中存在局限性,尤其是固有社会偏见的反映,导致行为偏离人类社会动态。研究通过自动自我微调方法强化了对偏见的操控,强调需进一步研究以提升模拟的现实性。

ElectionSim:由大型语言模型驱动的庞大人口选举模拟

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

大型语言模型在模拟人类行为方面有潜力,但在政治辩论中存在局限性,容易受社会偏见影响。研究通过自动自我微调展示了调整偏见的可能性,强调需进一步研究以改善模拟效果。

镜子中的偏见:大型语言模型的观点是否对自身的对抗攻击稳健?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究分析预训练语言模型中的社会偏见问题,发现去偏见后模型的词语表示对齐度下降。提出了一种微调方法,提升去偏见的公平性,同时保持自然语言理解任务的性能。

降级语言模型促进公平性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

大型语言模型在模拟人类行为方面有潜力,但在政治辩论中存在局限性,容易受到社会偏见影响。研究通过自动自我微调展示了调整偏见的可能性,强调需要进一步研究以实现更真实的模拟。

MindScope:通过多智能体系统探索大型语言模型中的认知偏见

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究探讨了大型语言模型(LLMs)在不同角色下对社会规范的理解差异,发现LLMs对社会规范的解读受分配角色的影响,且在同一社会人口特征类别内的解读也有所不同。比较受欢迎的角色更能准确理解社会规范,揭示了社会偏见对文化规范解读的影响。

“女性比男性更具文化知识吗?”:角色对大型语言模型中文化规范解读的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本研究探讨了大型语言模型(LLMs)在性别、职业等敏感类别上的社会偏见问题,并提出了一种去偏见机制,通过利用美国国家劳动统计局(NBLS)数据来减轻偏见。实证研究结果显示,去偏见方法显著降低了偏见评分,促进了模型的公平性和可靠性。

使用基础模型估计工资差异

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-15T00:00:00Z

近期自然语言处理的进展,特别是大型语言模型(LLMs)的出现,为构建精确复制人类行为的计算模拟提供了可能性。然而,LLMs在模拟人类互动方面存在局限性,特别是在模拟政治辩论方面。研究发现LLM代理倾向于符合固有的社会偏见,导致行为模式偏离人类社会动力学规律。研究使用自动自我微调方法来强化这些观察结果,并展示代理随后与改变后的偏见保持一致。这些结果强调了进一步研究的必要性,以开发帮助代理克服这些偏见的方法。

大语言模型生成结构上逼真的社交网络但高估政治同质性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码