小红花·文摘

追随问题的引导

MIT News - Artificial intelligence ·

国际认可 | 绿盟科技获评Gartner®《中国特权访问管理（PAM）市场指南》代表性厂商

绿盟科技技术博客 ·

本研究探讨了问答和阅读理解基准中的偏见问题，指出其在不同人群和地区的代表性不足，呼吁在基准创建中关注偏见，以促进公平的大语言模型发展。

流行问答基准中的社会偏见

BriefGPT - AI 论文速递 ·

打破障碍：女性在科技领域代表性的重要性

DEV Community ·

《黑人工智能女性协会》创始人谈人工智能教育与赋权

NVIDIA Blog ·

本研究解决了医学图像分割中有效选择训练子集的问题，尤其是在最小监督设置下，随机选择训练集可能导致模型性能不佳。我们提出了一种新的基于原型对比学习和聚类的样本选择方法，并引入无监督平衡批次数据加载，以提高模型在最少标注数据下的学习效果。在ISIC 2018公开皮肤病变数据集上的评估结果显示，我们的方法在低标注预算情境下表现优异。

结合平衡批次训练的关注代表性样本选择策略用于皮肤病变分割

BriefGPT - AI 论文速递 ·

代表性样本的诱惑：为何遥测在软件开发中依然占据主导地位

DEV Community ·

本研究探讨了时间投票模型中比例代表性验证的复杂性，发现时间投票的验证比多赢家投票更为复杂。针对特定情况，提出了高效算法，以提升时间投票系统的公平性和效率。

验证时间投票中的比例代表性

BriefGPT - AI 论文速递 ·

本研究针对大型语言模型（LLMs）在政治问题上的人类意图与价值对齐的难题进行探讨，填补了LLMs偏离经验立场的原因及条件研究的空白。采用认知科学中的代表性启发式理论，实验结果表明，LLMs在模仿特定政党的立场时，常常比人类受访者更夸大这些立场，揭示了LLMs对政治刻板印象的脆弱性，并提出了有效的基于提示的干预策略，以减少代表性对LLMs响应的影响。

通过代表性启发式检验大型语言模型的对齐：政治刻板印象的案例

BriefGPT - AI 论文速递 ·

本研究提出了一种新型主动采样算法（ATS），用于恢复图分析中的缺失节点属性。该算法通过评估节点信息的代表性和不确定性，展现出优越性，具有实际应用潜力。

Active Sampling for Node Attribute Completion in Graphs

BriefGPT - AI 论文速递 ·

本研究解决了在科学信息提取中由训练数据不足和高昂标注成本引发的挑战，提出了一种新的混合选择方法STAYKATE。该方法结合了主动学习中的代表性采样原理和基于检索的方法，研究结果显示STAYKATE在性能上显著优于传统的监督方法和现有选择方法，尤其对其他方法难以处理的实体类型表现更佳。

STAYKATE：结合代表性采样和基于检索的方法的混合上下文示例选择——以科学领域为案例研究

BriefGPT - AI 论文速递 ·

本研究解决了因缺乏分组信息而导致的，在识别少数群体时面临的困境。我们提出了一种"少数群体挖掘"问题，并通过几何变换和超平面排列的概念，设计了高效算法来发现潜在的代表性不足和表现不佳的群体。实验结果表明，我们的方法在挖掘这些未知少数群体方面具有显著的有效性。

挖掘少数群体：未知、代表性不足和表现不佳的少数群体

BriefGPT - AI 论文速递 ·

本文探讨了人工智能系统与人类价值观对齐的问题，提出了一种基于多智能体决策和人类认知模型的协作逆强化学习方法。研究强调道德价值对齐的重要性，并提出新的框架和奖励函数设计，以提高AI系统的道德一致性和透明性，确保其符合社会伦理标准。

民主化个性化和代表性价值对齐的奖励设计

BriefGPT - AI 论文速递 ·

本研究分析了在线新闻中不同种族和性别群体的表现频率及背景，发现这些群体代表性不足且常被边缘化，揭示了新闻报道中的种族和性别偏见。

A Longitudinal Analysis of Racial and Gender Bias in Images and Articles from The New York Times and Fox News

BriefGPT - AI 论文速递 ·

本研究解决了传统方法需要大规模数据集和广泛统计分析的问题，提出了一种利用双点相关函数从单张2D或3D图像直接估计微观结构特性方差的新方法。该方法显著降低了进行代表性分析的数据需求，并为材料科学家和工程师提供了实用的工具，促进了在微观结构数据有限的情况下进行相应的相分数预测。

从单张图像预测微观结构代表性

BriefGPT - AI 论文速递 ·

本文综述了大型语言模型（LLMs）的架构、训练策略及其在多语言环境中的应用，探讨了模型性能评估和未来研究方向。研究表明，针对低资源语言和欧洲官方语言的LLMs具有显著的性能提升潜力，并提出了提高多语言适应性的方法，以推动自然语言处理的平等与包容性。

从以英语为中心到有效的双语：支持低代表性语言的自定义分词器的大型语言模型

BriefGPT - AI 论文速递 ·

本研究解决了文本到图像生成系统中存在的可代表性偏见问题，提出了一个评估框架，关注多样性、包容性和质量三个方面。研究结果表明，该框架能够有效捕捉偏见，同时人类基础方法与模型基础方法之间在大部分组件中具高相关性，这有望降低成本并实现自动化。

文本到图像的可代表性公平性评估框架

BriefGPT - AI 论文速递 ·

本文探讨了主动学习和半监督学习在深度学习中的应用，提出了多种提高模型性能和训练效率的方法，包括基于后验熵的主动集合选择、样本自适应增强（SAA）和无监督选择性标注。这些方法在处理未标记数据和噪声标签时表现出色，显著提升了模型的准确性和鲁棒性。

通过代表性和多样化样本选择增强半监督学习

BriefGPT - AI 论文速递 ·

本文探讨了图神经网络（GNNs）在类别不平衡问题上的解决方案，提出了GraphSMOTE、GraFN和Fast Im-GBK等新方法，结合自监督学习和图异质性，显著提高了节点分类的准确性和效率。这些研究为不平衡节点分类提供了新的理论视角和实用框架。

Graffin：在不平衡节点分类中的尾部代表性

BriefGPT - AI 论文速递 ·

通过计算建模的方法，参与式生物医学研究通过适应性分配招募资源提高了代表性，使其在模拟的招募中获得了比现有基准更具代表性的队列，突出了计算建模在指导招募工作中的价值。

提高参与式生物医学数据中队列代表性的自适应招募资源分配

BriefGPT - AI 论文速递 ·