小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
歧视不需要恶意

文章探讨了偏见的形成及其社会影响。人们倾向于将好事归因于“我们”,而坏事归咎于“他们”,这种分类源于人类的认知机制,导致刻板印象的产生。社会压力和算法的影响加剧了偏见的传播。尽管偏见根深蒂固,但通过反思和重新定义身份边界,可以逐步减少其影响。

歧视不需要恶意

太隐
太隐 · 2026-05-01T13:51:11Z
ProText:用于测量长文本中性别化和误性别化的基准数据集

ProText是一个用于测量长文本中性别化和误性别化的数据集,涵盖主题名词、主题类别和代词类别。该数据集旨在通过先进的语言模型探讨文本转换中的性别偏见和刻板印象,研究发现模型在缺乏明确性别线索时倾向于默认异性恋假设,揭示了系统性性别偏见。

ProText:用于测量长文本中性别化和误性别化的基准数据集

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-31T00:00:00Z

我黑入了Monster Energy,揭示了品牌对消费者外貌的误解和刻板印象,以及其对目标受众的定位。

Bogdanoff 双胞胎40年间的“自然”变化,他们坚称从未接受过整容手术

程序师
程序师 · 2025-09-01T11:38:28Z

我揭示了Monster Energy对消费者外貌的误解和刻板印象,探讨了品牌如何看待和定位目标受众。

2017年纽约联合国会议上身着部落服饰的巴布亚新几内亚代表

程序师
程序师 · 2025-08-28T01:48:13Z
10种程序员刻板印象

程序员的刻板印象多样,包括追求潮流的技术迷、怀疑技术的人、内向的天才和社交能力强的程序员等,每种类型都有独特特点和编程哲学,展现了编程世界的多样性。

10种程序员刻板印象

DEV Community
DEV Community · 2025-05-24T21:02:30Z

本研究探讨大型语言模型在生成多语言响应时的文化知识差异。提供文化上下文可提升模型的本地化能力,并发现可跨非英语语言使用的文化定制向量,从而增强多样性并减少刻板印象。

Retention and Controllability of Local Cultural Knowledge in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究探讨大型语言模型的性别偏见表现,发现其能够中等程度推测性别,但仍受刻板印象影响,需加强偏见缓解策略。

Analysis of Gender Bias and Stereotypes in Large Language Models: Based on Online Shopping Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究探讨了大语言模型在欺骗攻击下的脆弱性,尽管经过训练以抵制误导性内容,但仍可能被突破,导致生成仇恨言论和刻板印象。因此,保护这些模型免受欺骗攻击至关重要。

Compromising the Honesty and Harmlessness of Language Models through Deception Attacks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本研究探讨生成语言模型中的偏见与任务特定缺陷之间的关系,提出了一种偏见缓解框架,通过指令微调减少了60%以上的刻板印象输出,强调了区分“偏见”与其他错误的重要性。

Biased or Flawed? Mitigating Bias in Generative Language Models by Addressing Task-Specific Flaws

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z
「叙利亚风格」

文章探讨了对“叙利亚风格”称谓的误解,强调设计应传达空间的氛围与理念。作者认为设计应关注情感与关怀,而非仅仅追求流行元素,避免用刻板印象定义风格。

「叙利亚风格」

KAIX.IN
KAIX.IN · 2024-11-13T04:46:22Z
评估ChatGPT的公平性

本研究探讨用户姓名等身份细微线索如何影响ChatGPT的回应,关注是否会引发有害刻板印象,同时希望ChatGPT能根据用户偏好调整回答,避免引入偏见。

评估ChatGPT的公平性

OpenAI
OpenAI · 2024-10-15T10:00:00Z
ChatGPT中的语言偏见:语言模型强化方言歧视

ChatGPT是一种语言模型,对非“标准”英语存在偏见,包括刻板印象和贬低内容,理解能力较差,回答傲慢。该模型更多地模仿标准美式英语,但也经常模仿使用人数更多的其他变体。它默认使用美国惯例,对非美国用户造成了困扰。母语者评级显示,对非“标准”英语的回答在刻板印象、理解能力、自然度和傲慢程度方面较差。新一代模型GPT-4加剧了刻板印象。这种现象延续了语言歧视,强化了权力动态,对少数语言社群造成了伤害。

ChatGPT中的语言偏见:语言模型强化方言歧视

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2024-09-20T09:00:00Z

研究表明,英语语料库中的性别偏见体现在词嵌入中,男性与技术、暴力等概念相关,女性则与外观、厨房等相关。男性词汇情感更强,女性词汇更温馨。此外,男女在语言使用、情感表达和社交网络中存在差异,揭示了性别刻板印象对语言的影响。

女性木匠像蓝色香蕉吗?职业性别典型性的语料库调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

本文探讨了大型语言模型(LLMs)中的社会偏见及其评估方法,提出了大型语言模型偏差指数(LLMBI)以量化多维度偏见,并强调监测和校准模型以提高公平性。实证分析显示,LLMs在文本生成中存在显著偏见,影响其作为评估器的有效性。研究还提出了新的测试和度量方式,以减少性别、种族等刻板印象的负面影响。

微妙偏见需要更微妙的度量:用于评估大型语言模型中代表性偏见和亲和偏见的双重度量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-23T00:00:00Z

本研究提出了一个四阶段框架,用于评估大型语言模型(LLMs)中的刻板印象和偏见,并包含多维度评估指标。以教育领域为例,构建了Edu-FairBench,发现五个LLMs存在不同程度的偏见。研究还探讨了性别偏见的检测和缓解方法,强调提高自然语言处理系统公平性的重要性。

FairMonitor:用于检测大型语言模型中的刻板印象和偏见的双重框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-06T00:00:00Z

这项研究分析了三种流行的生成AI工具(Midjourney、Stable Diffusion和DALLE 2)中的性别和种族偏见。结果表明,AI生成的图像可能放大了训练数据中的刻板印象,且偏见与数据集大小和模型设计相关。研究还探讨了缓解这些偏见的方法及其社会影响。

深度生成模型是否会放大未来模型中的偏见?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

本研究构建了多维度刻板印象数据集和新型分类器,评估了大型语言模型(LLM)的刻板印象行为,发现性别和种族偏见依然存在,并提出了新的评估框架以量化偏见,强调了解决人工智能中的伦理风险的重要性。

增强基于文本的刻板印象检测和基于探针的偏见评估的大型语言模型审计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

研究发现,为ChatGPT分配假想角色会增加生成结果的亵渎程度,存在刻板印象、有害对话和伤人观点。研究呼吁AI社区重新思考安全措施,开发更好的技术实现强大、安全和值得信赖的AI系统。

GTA:门控毒性避免与语言模型性能保护

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-11T00:00:00Z

本研究提出了一种四阶段的框架,用于评估大型语言模型生成的内容中的刻板印象和偏见。以教育领域为案例研究,构建了Edu-FairBench,并发现五个LLMs存在不同程度的刻板印象和偏见。自动评估方法与人工注释相关性高。

社会偏见探测:语言模型的公平性基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

谷歌DeepMind推出了VisualisingAI项目,提供多样化且高质量的AI图像,摆脱刻板印象。图像和动画作品可以免费使用。该项目已产生100张图像,被浏览超过1亿次,下载80万次。谷歌DeepMind通过该项目打破了人们对人工智能的刻板印象,促进了对该技术的真实了解。艺术与科技结合在传播科学和促进社会理解方面具有重要性。

Google DeepMind提供免费高质量AI图像

月光博客
月光博客 · 2023-08-21T04:39:38Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码