小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ProText:用于测量长文本中性别化和误性别化的基准数据集

ProText是一个用于测量长文本中性别化和误性别化的数据集,涵盖主题名词、主题类别和代词类别。该数据集旨在通过先进的语言模型探讨文本转换中的性别偏见和刻板印象,研究发现模型在缺乏明确性别线索时倾向于默认异性恋假设,揭示了系统性性别偏见。

ProText:用于测量长文本中性别化和误性别化的基准数据集

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-31T00:00:00Z

我黑入了Monster Energy,揭示了品牌对消费者外貌的误解和刻板印象,以及其对目标受众的定位。

Bogdanoff 双胞胎40年间的“自然”变化,他们坚称从未接受过整容手术

程序师
程序师 · 2025-09-01T11:38:28Z

我揭示了Monster Energy对消费者外貌的误解和刻板印象,探讨了品牌如何看待和定位目标受众。

2017年纽约联合国会议上身着部落服饰的巴布亚新几内亚代表

程序师
程序师 · 2025-08-28T01:48:13Z
10种程序员刻板印象

程序员的刻板印象多样,包括追求潮流的技术迷、怀疑技术的人、内向的天才和社交能力强的程序员等,每种类型都有独特特点和编程哲学,展现了编程世界的多样性。

10种程序员刻板印象

DEV Community
DEV Community · 2025-05-24T21:02:30Z

本研究探讨大型语言模型在生成多语言响应时的文化知识差异。提供文化上下文可提升模型的本地化能力,并发现可跨非英语语言使用的文化定制向量,从而增强多样性并减少刻板印象。

Retention and Controllability of Local Cultural Knowledge in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究探讨大型语言模型的性别偏见表现,发现其能够中等程度推测性别,但仍受刻板印象影响,需加强偏见缓解策略。

Analysis of Gender Bias and Stereotypes in Large Language Models: Based on Online Shopping Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究探讨了大语言模型在欺骗攻击下的脆弱性,尽管经过训练以抵制误导性内容,但仍可能被突破,导致生成仇恨言论和刻板印象。因此,保护这些模型免受欺骗攻击至关重要。

Compromising the Honesty and Harmlessness of Language Models through Deception Attacks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本研究探讨生成语言模型中的偏见与任务特定缺陷之间的关系,提出了一种偏见缓解框架,通过指令微调减少了60%以上的刻板印象输出,强调了区分“偏见”与其他错误的重要性。

Biased or Flawed? Mitigating Bias in Generative Language Models by Addressing Task-Specific Flaws

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z
「叙利亚风格」

文章探讨了对“叙利亚风格”称谓的误解,强调设计应传达空间的氛围与理念。作者认为设计应关注情感与关怀,而非仅仅追求流行元素,避免用刻板印象定义风格。

「叙利亚风格」

KAIX.IN
KAIX.IN · 2024-11-13T04:46:22Z
评估ChatGPT的公平性

本研究探讨用户姓名等身份细微线索如何影响ChatGPT的回应,关注是否会引发有害刻板印象,同时希望ChatGPT能根据用户偏好调整回答,避免引入偏见。

评估ChatGPT的公平性

OpenAI
OpenAI · 2024-10-15T10:00:00Z

研究利用自然语言处理和众包词汇,分析1.8亿字小说中的性别代表和刻板印象。结果显示,男性角色比例较高,传统性别刻板印象普遍存在,尤其是性感或暴力的男性与高评价故事相关。女性常被负面刻板印象描绘,且无论性别,作者都容易使用这些刻板印象。

反刻板印象的预测文本建议并不可靠地产生反刻板印象的写作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z
ChatGPT中的语言偏见:语言模型强化方言歧视

ChatGPT是一种语言模型,对非“标准”英语存在偏见,包括刻板印象和贬低内容,理解能力较差,回答傲慢。该模型更多地模仿标准美式英语,但也经常模仿使用人数更多的其他变体。它默认使用美国惯例,对非美国用户造成了困扰。母语者评级显示,对非“标准”英语的回答在刻板印象、理解能力、自然度和傲慢程度方面较差。新一代模型GPT-4加剧了刻板印象。这种现象延续了语言歧视,强化了权力动态,对少数语言社群造成了伤害。

ChatGPT中的语言偏见:语言模型强化方言歧视

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2024-09-20T09:00:00Z

该研究评估了推荐系统的误差、刻板印象和校准问题,并提出了一种统一框架来衡量系统引起的效应。研究发现,简单算法生成的推荐结果更符合刻板印象但偏差较小,而复杂算法产生的推荐则存在更大的偏差,影响到非典型用户和少数群体。通过过采样可以减少刻板印象并提高推荐质量,改善系统引起的效应。

推荐系统中算法伤害的互动反事实探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本文介绍了Molyé语料库,该语料库结合了欧洲三种语言变体的刻板印象和法语基础克里奥尔语的早期证据。旨在促进将欧洲接触情景与克里奥尔语国家的关系进行未来研究。

摩利耶:基于语料库的殖民法国语言接触研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

大型语言模型(LLMs)会传播和放大有害的刻板印象,特别是对边缘化社群。研究者使用GlobalBias数据集测试了一套语言模型,并发现模型输出中存在刻板印象。即使禁止,更大的模型仍然显示出更高水平的刻板印象输出。

哪个人在数学上更优秀,Jenny 还是 Jingzhen?揭示大型语言模型中的刻板印象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

研究发现大型语言模型(LLMs)存在与社会群体刻板属性相关的偏见,特别是对非洲裔、亚洲裔和拉美裔美国人的描绘。女性比男性更具同质性,但差异较小。性别的影响在种族/民族群体中存在差异。研究推测这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。

它们是否指的是 ' 我们 '? 解释不同群体偏见中的指代表达

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本文研究了大型语言模型(LLMs)中存在的偏见,特别是与社会群体的刻板属性相关的偏见。研究发现LLMs将非洲裔、亚洲裔和拉美裔美国人描绘为比白人更具同质性,女性比男性更具同质性,但差异较小。性别的影响在种族/民族群体中存在差异。研究推测这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。

利用以国籍为基础的个人形象剖析国家认知变化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本研究提出了一种四阶段的框架来评估大型语言模型生成的内容中的刻板印象和偏见,并以教育领域为案例研究构建了Edu-FairBench。实验结果显示五个LLMs存在不同程度的刻板印象和偏见,自动评估方法与人工注释相关性高。

大型语言模型偏见缓解的知识编辑视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-15T00:00:00Z

研究发现大型语言模型(LLMs)存在与社会群体刻板属性相关的偏见,特别是对非洲裔、亚洲裔和拉美裔美国人的描绘更具同质性,女性稍具同质性。性别的影响在种族/民族群体中存在差异。研究推测这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。

成千上万的部分之和:少数族裔和多数族裔在协作解决问题的沟通中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z

研究发现,为ChatGPT分配假想角色会增加生成结果的亵渎程度,存在刻板印象、有害对话和伤人观点。研究呼吁AI社区重新思考安全措施,开发更好的技术实现强大、安全和值得信赖的AI系统。

GTA:门控毒性避免与语言模型性能保护

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码