小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
解决“打地鼠困境”:一种更智能的去偏见AI视觉模型的方法

WRING是一种新型去偏见技术,通过调整模型中特定坐标的表示方式,减少目标概念的偏见,同时不增加其他领域的偏见。该方法高效且无需重新训练模型,适用于视觉语言模型(VLM),如CLIP模型。研究表明,WRING在减少偏见方面效果显著。

解决“打地鼠困境”:一种更智能的去偏见AI视觉模型的方法

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-04-29T21:40:00Z

马斯克的Grokipedia和SciencePedia在AI重写知识库方面各有侧重。Grokipedia旨在成为Wikipedia的替代品,强调去偏见,但上线遇挫。SciencePedia专注于科学知识的结构化,提供可验证的知识网络,目标更务实。两者面向不同用户,前者适合快速获取信息,后者适合深入学习与研究。

AI 重写知识库?马斯克 Grokipedia 对上科学界的 SciencePedia,Wikipedia:那我走?

量子位
量子位 · 2025-10-29T10:16:15Z

本研究探讨大型语言模型(LLMs)在社会模拟中作为类人决策代理的行为,填补了其角色和上下文影响的研究空白。研究提出了一种定量修改决策过程的方法,旨在对AI代理的设计和去偏见产生重要影响。

引导亲社会AI代理:大型语言模型在社会模拟中的决策计算基础

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本研究提出了一种弯曲VLM方法,旨在解决视觉语言模型嵌入中的社会偏见问题。该方法无需微调,能够根据输入动态调整去偏见操作,从而提升灵活性和适用性。

Curved Vision-Language Models: Debiasing Visual-Language Embeddings at Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本研究分析预训练语言模型中的社会偏见问题,发现去偏见后模型的词语表示对齐度下降。提出了一种微调方法,提升去偏见的公平性,同时保持自然语言理解任务的性能。

降级语言模型促进公平性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z
映射大语言模型的思维 [译]

研究人员通过内部观察发现AI模型中数百万个概念的表示方式,包括金门大桥和抽象概念,这些发现有助于提高模型的安全性。研究人员希望利用这些发现来监控危险行为、去偏见和改进其他安全技术。他们还发现了与阿谀奉承赞美相关的功能。然而,仍需进一步研究模型的表示和提高安全性。

映射大语言模型的思维 [译]

宝玉的分享
宝玉的分享 · 2024-05-21T16:20:00Z

本文综述了视觉问答(VQA)领域的研究进展,包括数据集发展、评估指标、去偏见方法和稳健性。还讨论了VQA中的视觉与语言预训练模型,并探讨了未来研究的关键领域。

属性多样性决定了 VQA 中的系统性差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码