小红花·文摘

上海AI实验室推出OpenDataArena平台，旨在科学评估数据价值，涵盖多个领域和基准测试。该平台提供公平透明的数据评测，帮助研究者识别高质量数据，降低试错成本，促进数据生成与应用。

告别“炼丹玄学”：上海AI实验室推出首个大模型数据竞技场OpenDataArena

量子位 ·

三个问题：如何帮助学生识别人工智能数据集中的潜在偏见

MIT News - Artificial intelligence ·

本研究探讨大型语言模型在气候问题上的忠实性不足，提出ClimateGPT Faithful+模型，通过自动评估和排除不忠实数据，将支持声明的忠实性从30%提升至57%。

Listening to the Context: Towards Faithful Large Language Models for Retrieval-Augmented Generation on Climate Issues

BriefGPT - AI 论文速递 ·

如何在SQL中检查bRowNum列的值是否大于1？

DEV Community ·

本文提出了多种新型数据评估和异常检测方法，包括基于袋外估计的 Data-OOB、无监督的 Out-of-Bag 异常检测和基于极值的 XOOD 框架。这些方法在处理多维数据集时表现优异，能够提高机器学习系统的准确性和可靠性，有效识别有用或有害的数据点。

2D-OOB：通过联合估值框架归因数据贡献

BriefGPT - AI 论文速递 ·

本文介绍了一种新的数据估值框架OpenDataVal，利用Wasserstein距离和敏感性分析方法，能够有效识别低质量数据并提升性能。该框架支持多种数据估价算法的比较，并通过实验验证了其有效性。此外，介绍了高效聚类框架SkeVa family和新数据评估方法Data-OOB，均在大规模数据集上表现优异。

SAVA: 可伸缩的学习无偏数据估值

BriefGPT - AI 论文速递 ·

该研究论文探讨了图神经网络在决策过程中透明度不足的问题，并提出了解决方法和数据评估。研究还探讨了合成数据生成、评估指标和解释呈现等领域的问题，并提出了缓解建议。

在保留解释的图扰动下的 PAC 可学习性

BriefGPT - AI 论文速递 ·

本文提出了解决强化学习困难的方法，包括使用多个奖励模型进行数据评估和投票机制消除数据中的错误和模糊偏好，引入对比学习和元学习增强奖励模型的区分能力和泛化能力，实现迭代优化。

迭代数据平滑：在 RLHF 中缓解奖励过拟合和过优化

BriefGPT - AI 论文速递 ·