小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
关于肥胖的杂谈

作者表达了对糖和油的厌恶,反映出对肥胖的恐惧。因抗癫痫药物影响,体重曾达到210斤,导致自卑。尽管减重后仍对体型敏感,强调健康饮食和锻炼。文章探讨了肥胖羞耻及社会偏见,呼吁理性看待肥胖与健康。

关于肥胖的杂谈

極客死亡計劃
極客死亡計劃 · 2025-08-28T14:16:00Z
通过核心指代解析中的信心差异研究大型语言模型中的交叉偏见

大型语言模型(LLMs)在招聘和招生等资源有限的环境中被广泛应用,但可能反映和加剧社会偏见。研究扩展了单轴公平评估,关注交叉偏见,创建了WinoIdentity基准,评估245,700个提示中的50种偏见模式。结果显示,LLMs在某些身份群体上的信心差异可达40%,尤其在反刻板印象的情境中,对双重弱势身份的信心最低。这表明LLMs的表现可能更多依赖于记忆而非逻辑推理。

通过核心指代解析中的信心差异研究大型语言模型中的交叉偏见

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-18T00:00:00Z
人工智能的人文视野

人工智能已深入生活各领域,影响个人选择与社会结果。我们需警惕技术依赖,建立透明且用户可控的系统,以应对隐私风险。同时,AI可能加剧社会偏见,需多方合作解决。有效治理应灵活应对技术变化,确保伦理与人类尊严。通过集体努力,我们能构建以人类价值为核心的AI未来。

人工智能的人文视野

DEV Community
DEV Community · 2025-05-23T23:00:00Z

本研究提出了一种新方法,通过识别嵌入空间中的语义方向向量,将文本嵌入限制在安全区域,以应对扩散模型生成不安全内容和社会偏见的问题。该方法增强了模型对潜在不安全提示的鲁棒性,并在多个基准数据集上显著减少了NSFW内容和社会偏见。

Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究探讨了维基数据知识表示中的社会偏见,特别是在链接预测任务中对少数群体的影响。提出的AuditLP框架利用公平性指标识别性别和年龄偏见,发现偏见结果与全球北方和南方的社会经济文化分区相关。

Social Biases in Knowledge Representations of Wikidata Separate Global North from Global South

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z
揭示人工智能中的偏见:FairCode基准用于代码生成

在人工智能影响日益加深的背景下,算法偏见问题备受关注。文章介绍了“FairCode基准”,旨在评估和减轻代码生成中的社会偏见。研究显示,性别和种族等因素导致的偏见影响招聘、教育和医疗等领域。通过FairScore指标,开发者可以量化模型表现,推动更公平的AI系统,确保技术惠及所有人。

揭示人工智能中的偏见:FairCode基准用于代码生成

DEV Community
DEV Community · 2025-01-11T08:08:54Z

本研究提出了FairCode基准,用于评估代码生成中的社会偏见。结果表明,所有测试的大型语言模型均存在偏见,强调了评估其社会偏见的重要性。

Fair Code: Assessing Social Bias in Code Generation of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一种局部反事实生成方法,旨在减少基础模型中的社会偏见。通过自动遮罩和引导修复,限制反事实修改在特定属性区域,保持图像上下文,提高性别反事实的视觉和语义保真度。这为创建平衡数据集提供了框架,以便进行准确的偏见分析和有效的缓解。

Pinpoint Counterfactuals: Reducing Social Bias in Foundation Models via Localized Counterfactual Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种扩展BBQ数据集的方法,以评估大型语言模型在开放情境中的社会偏见。结果显示,模型对特定特征(如年龄和社会经济地位)存在偏见,但通过结合零-shot、少量样本和思维链的方法,可以显著降低这些偏见。

Evaluating and Mitigating Social Biases of Large Language Models in Open Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种弯曲VLM方法,旨在解决视觉语言模型嵌入中的社会偏见问题。该方法无需微调,能够根据输入动态调整去偏见操作,从而提升灵活性和适用性。

Curved Vision-Language Models: Debiasing Visual-Language Embeddings at Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本文探讨了大型语言模型(LLMs)在上下文学习中的公平性和性能问题,提出了一种选择最佳示范的算法以提高学习效果。实验表明,模型在处理表格数据时可能继承社会偏见,提出了优化样本选择的方法以增强公平性。此外,研究还探讨了因果关系在提高模型可信度中的应用。

通过潜在概念变量实现公平的上下文学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

两项研究表明大型语言模型(LLMs)在模拟心理变化和政治行为方面具有潜力。第一项研究发现LLMs能有效模拟虚假真相效应,第二项研究探讨了民粹主义新闻框架的影响。研究指出LLMs在模拟人类群体动态时存在局限性,尤其在政治辩论中可能表现出固有的社会偏见,整体上倾向于左翼观点,并在预测公众舆论时存在偏差,强调了谨慎使用LLMs的必要性。

隐藏的劝说者:大型语言模型的政治倾向及其对选民的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出关注指令调优(FIT)方法,旨在解决大型语言模型(LLMs)在不同上下文中因伪特征和偏见特征导致的不良行为。FIT通过专注于特定特征,提高模型的鲁棒性,减少社会偏见,确保在新环境中的表现,从而推动LLM的稳健性、公平性和可控性。

Focus on This, Not That! Steering Large Language Models with Adaptive Feature Specification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文探讨了大型语言模型(LLMs)在选举模拟和公众舆论预测中的应用。研究发现,LLMs在模拟选民行为时存在偏差,尤其在不同政治环境中表现不一。通过分析推特数据和选举结果,研究表明LLMs在预测个体和整体偏好方面具有潜力,但也存在固有的社会偏见,需谨慎应用于民主进程中。

ElectionSim:由大型语言模型驱动的庞大人口选举模拟

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究提出了文本到图像生成技术的内容管理框架,强调安全、公平和量化危害的重要性。通过分析隐式对抗提示,识别T2I模型的安全问题,并开发了AEGISSAFETYDATASET和AEGIS方法来评估模型的安全性能。此外,研究揭示了AI生成文本中的社会偏见,推动了AI伦理学的发展。

多模态安全感知中的分歧模式洞察:来自多样化评估组的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本文探讨了口吃障碍的分类方法,利用声学特征、深度学习和统计学填补研究空白。分析了环境噪音对机器学习模型的影响,提出了改进口吃检测系统的数据分割策略,并探讨了自动化失语症评估的潜力。同时,研究关注了机器学习在喉癌检测中的应用及其统计效力,强调了社会偏见对大型语言模型的影响。

机器能否区分语音中的高低社交裂纹

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本文探讨大型语言模型(LLMs)中的社会偏见,特别是在政治、宗教和性别方面的表现。研究发现,LLMs在模拟人类互动时存在固有偏见,且即使经过微调,偏见依然显著。提出了一种新方法,通过多角色情境和公正裁判角色来减少偏见,实验结果表明该方法有效提升了LLMs的偏见识别能力,强调了开发更伦理的AI系统的重要性。

镜子中的偏见:大型语言模型的观点是否对自身的对抗攻击稳健?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

该研究探讨了深度学习生成文本中的社会偏见,发现机器生成的文本在多个领域比人类撰写的文本更具偏见。研究提出了新的偏差测量数据集和评估框架,强调在评估大型语言模型的公平性时需谨慎,尤其是在经济偏见和人口属性方面。研究结果表明,偏见在不同模型中普遍存在,呼吁采取有效的偏见缓解技术。

评估大型语言模型开放式生成偏见的指标模型偏见基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本研究分析预训练语言模型中的社会偏见问题,发现去偏见后模型的词语表示对齐度下降。提出了一种微调方法,提升去偏见的公平性,同时保持自然语言理解任务的性能。

降级语言模型促进公平性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究分析了大型语言模型(LLMs)在仇恨言论生成解释中的表现,发现其解释在流畅性和逻辑性上评价较高,但不同提示策略会影响说服力,可能导致错误判断。同时,研究探讨了LLMs中的社会偏见,强调在内容审核中需谨慎使用这些模型,以避免强化刻板印象。

仇恨具象化:探讨大型语言模型在内容审查中的角色

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码