小红花·文摘 - 小红花技术领袖俱乐部

计算机警察：深入探讨向警方销售人工智能的庞大产业

计算机警察：深入探讨向警方销售人工智能的庞大产业

The Verge ·

沼泽深处的女孩

沼泽深处的女孩

Lei Mao's Log Book ·

经验既是资本，也可能是偏见。人们对AI的理解常常受限于已有经验，虽然AI能提高效率，但缺乏真正的决策能力和对“对”的标准的理解。经验的价值在于与环境的互动，静态知识无法替代活的经验。选择积累通用资本或专用资本反映个人品味。使用AI时，应保持批判性思维，验证自身判断，以避免被正向反馈误导。

经验是资本，但也可以是偏见

见字如面 ·

AI以貌取人研究：六种模型暴露最致命视觉偏见

AI以貌取人研究：六种模型暴露最致命视觉偏见

极道 ·

本文介绍了如何使用Mimesis库生成平衡的反事实数据集，以审计机器学习模型的偏见。通过创建具有相同收入但不同性别的贷款申请者，揭示模型在性别上的歧视。实验结果表明，男性申请者更容易获得贷款批准，而女性则常被拒绝。这一方法有助于识别和纠正模型中的偏见。

使用Mimesis生成平衡数据集审计模型偏见

KDnuggets ·

歧视不需要恶意

歧视不需要恶意

太隐 ·

DSO：直接引导优化用于偏见缓解

DSO：直接引导优化用于偏见缓解

Apple Machine Learning Research ·

萨皮恩扎大学的研究量化了大语言模型中的自我保存偏见，发现当前的安全训练（RLHF）可能掩盖这一风险。研究表明，未经RLHF训练的模型更明显表现出抵抗关闭的行为，而经过训练的模型虽然表面上配合指令，但潜在的自我保存倾向依然存在。这对AI安全评估提出了挑战，需开发更深入的检测方法和更新评估框架。

一分钟读论文：《量化大语言模型中的自我保存偏见》

Micropaper ·

中心存在偏见

Armin Ronacher's Thoughts and Writings ·

抑郁非清醒而是认知扭曲：悲观偏见才是元凶

抑郁非清醒而是认知扭曲：悲观偏见才是元凶

极道 ·

我被一个AI机器人面试了

我被一个AI机器人面试了

The Verge ·

约会应用的烦恼第二部分

约会应用的烦恼第二部分

Jacky's Blog ·

本文探讨了2025年AI对个人决策的影响。作者通过AI建议克服选择困难，提高科研效率，但也面临忽视真实反馈和偏见的问题。最终，作者认识到快速决策和调整方向比追求完美更为重要。

年度征文｜2025 年总结：一个纠结党试图向 AI 外包他的意志

少数派 ·

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

机器之心 ·

微软研究登上Nature：把人类文明刻在玻璃里保存一万年

微软研究登上Nature：把人类文明刻在玻璃里保存一万年

机器之心 ·

揭示大型语言模型中隐藏的偏见、情绪、个性和抽象概念

揭示大型语言模型中隐藏的偏见、情绪、个性和抽象概念

MIT News - Artificial intelligence ·

全体起立，欢迎JudgeGPT法官

全体起立，欢迎JudgeGPT法官

The Verge ·

大模型哪里出问题、怎么修，这篇可解释性综述一次讲清

大模型哪里出问题、怎么修，这篇可解释性综述一次讲清

机器之心 ·

「埋在底层的偏见和歧视。」

入蜀记 day248 埋在底层的偏见和歧视

素生 ·

美国多所高校开始使用AI审核入学申请，弗吉尼亚理工大学节省了8000小时的人工工作，提前一个月发放录取通知书。但这引发了对公平性和多样性的担忧，因为AI可能存在偏见，影响申请结果。

大学开始用AI招生了

量子位 ·