小红花·文摘

本文提出了一种新的零-shot自动化作文评分方法——比较作文评分（LCES），旨在解决模型偏差和评分不一致的问题。通过成对比较任务，LCES 提高了评分的准确性和可扩展性，实验结果表明其优于传统评分方法。

LCES: A Zero-Shot Automated Essay Scoring Method Based on Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新的联邦数据量感知加权平均方法(FedDua)，旨在解决不诚实客户因报告不准数据量而导致的模型偏差问题。实验结果显示，FedDua在数据量声明不准确的情况下，全球模型性能平均提升3.17%。

针对不诚实客户的联邦学习本地数据量感知加权平均

BriefGPT - AI 论文速递 ·

本研究提出VAPO框架，解决了价值基础强化学习在长链推理中的局限性，有效应对模型偏差、序列长度和奖励稀疏问题，在AIME 2024数据集上取得了60.4的最佳成绩。

VAPO: 高效可靠的强化学习框架用于高级推理任务

BriefGPT - AI 论文速递 ·

本研究探讨数据增强对机器学习模型偏差的影响，提出了一种测试偏差的方法，分析增强样本在测试集中的作用，旨在提高软件工程中模型评估的准确性，尤其是在数据稀缺的情况下。

Evaluating the Bias in Training and Testing of Machine Learning Models Induced by Data Augmentation

BriefGPT - AI 论文速递 ·

谷歌广告的成功依赖于广告的相关性。用户标记广告为“不相关”可能影响谷歌的算法，导致广告定位不准，影响广告商的表现和成本。数据操控可能引发模型偏差，影响广告效果，削弱广告生态系统的有效性。谷歌需优化模型以应对这种挑战。

用户操控如何影响谷歌的广告模型

DEV Community ·

本文探讨了深度学习模型的可解释性，提出了多种方法以提高模型的解释能力而不影响准确性，包括DISSECT方法、知识解释蒸馏（KED）框架和概念敏感训练。这些方法旨在消除模型偏差、增强泛化能力，并通过实验证明其有效性，为理解和改进神经网络提供了新的思路。

无梯度后期可解释性的蒸馏辅助学习方法

BriefGPT - AI 论文速递 ·

本文探讨生成式AI模型（如GAN和VAE）在医疗领域创建逼真匿名患者数据的应用，分析合成数据的益处与挑战。研究表明，合成数据在保护患者隐私、平衡数据集和减少模型偏差方面具有显著优势，但仍需解决潜在的负面影响和质量控制问题。

NFDI4Health工作流程与合成数据生成、评估和风险管理服务

BriefGPT - AI 论文速递 ·

本研究探讨了黑盒后门攻击的实施可能性，攻击者可以在不知模型结构的情况下，通过设计后门触发器进行攻击。实验结果表明，该方法在黑盒场景中的成功率高，并能有效规避现有防御措施。此外，研究提出了一种基于知识蒸馏的去偏差框架，能够有效降低模型的偏差和安全风险，强调了对抗性防御机制的重要性。

可撤销的深度模型交易的后门

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，解决少样本增量学习中的模型偏差问题，通过激发映射能力和自优化分类器等步骤显著改善模型性能。文章分析了FSCIL的进展，提出五个子领域，并探讨其在计算机视觉和自然语言处理中的应用。实验结果显示，该方法在多个基准数据集上表现优异。

Rethinking Few-Shot Class-Incremental Learning: Learning from Oneself

BriefGPT - AI 论文速递 ·

本文探讨了公平感知机器学习中的真实世界数据集，分析了在线个性化设置中的公平性问题，并提出了多种方法来缓解模型偏差，包括评估个人排名算法的公平性和提高推荐系统的公平性。

公正岗位：一个用于在线系统公平性的现实世界数据集

BriefGPT - AI 论文速递 ·

文献阅读（四）

seisamuse ·

在少样本增量学习（FSCIL）中，现有方法常将新类别样本误分类为基类别，影响新类别性能。为此，提出了一种校准策略TEEN，通过融合新类别与加权基类别原型，提升可区分性。该方法在多个基准测试中表现优异，显著减轻模型偏差问题，并在多个数据集上取得领先性能。

探索基础类别混淆：针对少样本学习的冗余探索

BriefGPT - AI 论文速递 ·

本文研究了自然语言处理（NLP）模型中的偏差及其消除方法，提出了多种去偏框架和学习策略，以提高模型的稳健性和迁移能力。研究通过实验验证了内在偏差指标作为评估去偏效果的标准，并探讨了偏差的主要来源及其对模型性能的影响，旨在实现公平学习和道德使用数据。

信息提取是否存在一种适用于所有模型的方法？重新审视任务定义偏见

BriefGPT - AI 论文速递 ·

该研究评估了具有歧视性基础模型的偏差，并对现有的缓解这些模型偏差的方法进行了系统评估。研究者使用公平 PCA 方法进行去偏，发现其在大多数任务的去偏中效果非常好，同时只带来了轻微的性能损失。不同的去偏方法在不同的任务中的有效性有所不同。

评估计算机视觉中的判别基础模型的公平性

BriefGPT - AI 论文速递 ·

本文介绍了一种基于模型的强化学习算法USB-PO，通过优化目标统一模型漂移和模型偏差，并制定了一种自适应微调过程，以获得性能改进保证，同时避免模型过拟合。实证结果表明，该算法在几个具有挑战性的基准任务上实现了最先进的性能。

模型基强化学习中解决客观差异的统一视角

BriefGPT - AI 论文速递 ·

本文介绍了一种新的FL算法CA-Fed，平衡收敛速度和模型偏差，忽略可用性低和相关性大的客户。实验结果表明，CA-Fed比现有算法具有更高的时间平均准确性和更低的标准差。

基于元胞自动机的联邦学习智能客户端选择

BriefGPT - AI 论文速递 ·

本文介绍了一种名为USB-PO的基于模型的强化学习算法，通过统一模型漂移和模型偏差，并制定了一种自适应微调过程，以获得性能改进保证，同时避免模型过拟合。实证结果表明，USB-PO在几个具有挑战性的基准任务上实现了最先进的性能。

如何微调模型：统一模型偏移与模型偏差策略优化

BriefGPT - AI 论文速递 ·

本文研究了减轻大型语言模型毒性的策略及其对模型偏差和质量的影响。研究发现，干预策略可以优化自动指标，但会减少对边缘化团体和方言的覆盖率。强减毒干预后，人类评分员通常不同意高自动毒性得分，凸显了评估语言模型毒性的复杂性。

逐步解毒语言模型

BriefGPT - AI 论文速递 ·

本文介绍了一种名为LANCE的算法，用于自动化模型应力测试。该算法利用语言引导和文本编辑技术，增加了IID测试集的多样性和挑战性，而不改变模型权重。作者对多个预训练模型进行了测试，发现它们在性能上有显著且一致的下降。此外，作者还分析了不同类型编辑对模型的敏感性，并展示了其在揭示ImageNet中未知类别级别模型偏差方面的应用。

医学图像分类中的鲁棒性压力测试

BriefGPT - AI 论文速递 ·