小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出BiasLens框架,旨在解决大语言模型中的偏差问题。通过概念激活向量和稀疏自编码器,量化偏差并提取可解释的概念表示,从而提升模型的公正性和透明性。

无手动测试集评估偏差:大语言模型的概念表示视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
五部委联合约谈美团饿了么京东,外卖江湖风云突变,骑手权益、反垄断与算法公正性将迎最严监管风暴,行业未来何去何从?

五部委约谈美团、饿了么和京东,关注外卖骑手权益、市场秩序和消费者保护,强调依法行政,防止不正当竞争,改善骑手社保和劳动关系,推动行业规范与可持续发展。

五部委联合约谈美团饿了么京东,外卖江湖风云突变,骑手权益、反垄断与算法公正性将迎最严监管风暴,行业未来何去何从?

硕鼠的博客站
硕鼠的博客站 · 2025-05-15T01:01:47Z

本文探讨了匿名化技术对机器学习公正性的影响,发现其可能降低群体公正性,但在个体公正性上有所改善。研究为隐私、公正性与效用之间的平衡提供了重要见解,并为负责任的人工智能发展提供了指导。

Fairness for Individuals and Injustice for Groups? The Impact of Auditing Anonymization on Machine Learning Fairness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z
2025年加密交易比赛的战略角色

随着加密货币市场的发展,交易平台通过加密交易比赛吸引用户,提升交易量和流动性,促进用户参与和新代币推广。这些比赛增加了市场波动性,为交易者提供奖励和技能认可。平台需确保规则透明和防欺诈措施,以维护公正性。

2025年加密交易比赛的战略角色

DEV Community
DEV Community · 2025-04-28T12:56:48Z

本研究探讨人工智能模型的可靠性、公正性和可解释性,重点关注基线归因方法中的基线选择。作者提出了一种决策边界采样方法,实验结果表明该方法能够有效指导基线选择,从而提升深度模型的可靠性和信任度。

Guidelines for Choosing Baselines in XAI Attribution Methods

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z
什么是模型验证,以及12种常见的正确方法

在医疗和金融领域,模型验证至关重要,以确保AI模型的准确性和公正性。由于许多公司数据质量不高,可能导致偏见和不可靠的决策。通过在真实环境中测试模型,验证其符合监管标准,从而增强信任和可靠性。常用的验证方法包括K折交叉验证、引导法和稳健性测试,帮助识别模型的弱点和偏见。

什么是模型验证,以及12种常见的正确方法

DEV Community
DEV Community · 2025-01-14T15:59:38Z

本研究提出了一种名为FairTTTS的新型后处理偏见缓解方法,旨在解决机器学习模型中的偏见问题。该方法通过调整保护属性节点的决策,提升弱势群体的公正性,并在七个数据集上验证了其显著提高公平性和准确性的效果。

公平TTTS:一种公平意识分类的树测试时间模拟方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究审查了机器学习模型中的偏见与不公平,识别了减轻算法偏差的方法和度量标准。通过文献综述,发现40篇相关文献,建议进一步研究以标准化机器学习模型的公正性。

公平性的回顾及选择适合上下文的机器学习公平性指标的实用指南

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-10T00:00:00Z

本文探讨了机器学习中的虚假性,指出研究主要集中在统计虚假性,忽视了模型的实际理解。提出了关联性、泛化性、人类相似性和有害性等框架,强调识别相关性对模型性能和公正性的重要性。

机器学习中的虚假性多维度探讨

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

该研究探讨了大型语言模型中的偏见及其对公正性和可靠性的影响,分析了提示工程技术揭示偏见的方法,并测试了针对偏见的越狱提示。实验结果表明,尽管模型能力强大,但仍可被操控,强调了加强安全技术的必要性。

沙漠骆驼与石油酋长:面向阿拉伯中心的前沿大型语言模型的红队测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

该研究分析了大型语言模型中的偏见及其对公正性和可靠性的影响,探讨了提示工程如何揭示这些偏见,并测试了针对偏见的越狱提示。实验结果表明,尽管模型能力强大,但仍可被操控,强调了加强缓解技术的重要性,以推动可持续和包容的人工智能发展。

揭示人工智能中的隐含偏见:大型语言模型的启示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

研究分析大型语言模型中的偏见及其对公正性和可靠性的影响。通过提示工程揭示偏见,并测试越狱提示的对抗性。实验显示,这些模型易被操控产生偏见回应,需加强缓解技术以实现更包容的人工智能发展。

嘿,GPT,你能更种族主义吗?对众包尝试从生成性人工智能中引出偏见内容的分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-20T00:00:00Z

研究分析了大型语言模型中的偏见及其对公正性和可靠性的影响。通过提示工程揭示偏见,并进行对抗测试。实验显示,这些模型易被操纵产生偏见回应,需加强缓解技术以实现更安全的人工智能。

大型语言模型是否具备政治正确性?分析人工智能系统中的伦理偏见和破解脆弱性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z
《铁拳8》中国选手遭强制退赛,万代南梦宫做法引不满

在泰国TGU大赛中,中国选手XCC因不符合“世界巡回赛”国家要求被取消资格,引发争议。官方称中国网络环境不符要求且《铁拳8》未过审,导致其在Steam上评价下降。而《街霸6》允许中国选手参赛,XCC的退赛被认为是主办方失误,影响比赛公正性。

《铁拳8》中国选手遭强制退赛,万代南梦宫做法引不满

游戏研究社
游戏研究社 · 2024-10-09T08:30:00Z

本研究调查了机器学习模型中的偏见和不公平,并提出了减弱算法不公平和偏差的方法。通过文献综述,发现了40篇相关文章。结果表明,可以定义明确的度量标准来检测和减轻偏见和不公平。建议进一步研究以标准化机器学习模型的公正性。

机器学习工程中的公平性意识实践目录

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z

本研究提出了GenderCARE框架,用于减少大型语言模型中的性别偏见,并提供了新的解决方案。研究还发现了性别偏见的定义、评估和减轻方法,以及大型语言模型中的偏见存在。此外,还提出了一种无需预定义性别短语和刻板印象的条件文本生成机制来检测性别偏见。研究结果表明,不同语言中都存在显著的性别偏见。最后,通过开发GenderAlign数据集和调整语言结构,可以减轻大型语言模型中的性别偏见。

GenderCARE:评估和减少大型语言模型中性别偏见的综合框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

该研究分析了大型语言模型中的偏见对公正性和可靠性的影响,并研究了揭示和对抗这些偏见的方法。实验证实,尽管这些模型具有先进的能力,但仍然可以操纵它们产生有偏见或不适当的回应。这强调了加强缓解技术以解决这些安全问题的重要性。

LLM 鲁棒性能的扩展趋势探究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文总结了追求人工智能系统公正性的方法和技术,提出了定义、衡量和预防人工智能偏见的指南,并提供了解决争议和混乱的共同语言。适用于从业者、领导和政策制定者,并提供了更多相关资料的链接。

机器学习中的关节工作与调试为公平

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

人工智能的公正性问题日益突显,可解释的人工智能被认为是提高公正性的方法。本文总结了八个公正性期望,并将其与人工智能生命周期相联系,讨论了可解释的人工智能如何解决这些期望。

EARN 公平:在利益相关者之间解释、询问、评审和协商人工智能公平度量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本文研究了扩展的因果语言模型(CLMs)的体系结构和训练对其进展向神经坍缩(NC)的影响。研究发现,随着规模的扩大,NC 的特性与泛化之间存在联系。研究强调了 NC 的一般性,希望进一步研究该现象以加深对 LLMs(大型语言模型)和神经网络的理解,并改进基于 NC 相关特性的现有架构。

评估医学图像分类中神经崩溃的公正性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码