小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种新的零-shot自动化作文评分方法——比较作文评分(LCES),旨在解决模型偏差和评分不一致的问题。通过成对比较任务,LCES 提高了评分的准确性和可扩展性,实验结果表明其优于传统评分方法。

LCES: A Zero-Shot Automated Essay Scoring Method Based on Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种新的联邦数据量感知加权平均方法(FedDua),旨在解决不诚实客户因报告不准数据量而导致的模型偏差问题。实验结果显示,FedDua在数据量声明不准确的情况下,全球模型性能平均提升3.17%。

针对不诚实客户的联邦学习本地数据量感知加权平均

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出VAPO框架,解决了价值基础强化学习在长链推理中的局限性,有效应对模型偏差、序列长度和奖励稀疏问题,在AIME 2024数据集上取得了60.4的最佳成绩。

VAPO: 高效可靠的强化学习框架用于高级推理任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究探讨数据增强对机器学习模型偏差的影响,提出了一种测试偏差的方法,分析增强样本在测试集中的作用,旨在提高软件工程中模型评估的准确性,尤其是在数据稀缺的情况下。

评估数据增强引起的机器学习模型训练和测试偏差

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本文提出了一种新方法,通过利用上下文信息优化深度网络训练,以解决视觉数据标注不足的问题。研究引入上下文多样性,提出数据修复算法以减少模型偏差,并建议使用类基注释应对领域转移。优化数据策略和融入人类反馈显著提升模型在复杂环境下的表现。

利用视觉数据的上下文不确定性提高深度模型的高效训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本文分析了FedAvg类联邦学习算法在不同客户下的收敛性,指出相关性对收敛速率的负面影响,并提出新算法CA-Fed,以平衡收敛速度与模型偏差,忽略低可用性和高相关性的客户。实验结果表明,CA-Fed在准确性和标准差上优于现有算法。

关于谱模型分片的采样策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

谷歌广告的成功依赖于广告的相关性。用户标记广告为“不相关”可能影响谷歌的算法,导致广告定位不准,影响广告商的表现和成本。数据操控可能引发模型偏差,影响广告效果,削弱广告生态系统的有效性。谷歌需优化模型以应对这种挑战。

用户操控如何影响谷歌的广告模型

DEV Community
DEV Community · 2024-09-30T16:59:42Z
文献阅读(四)

研究全球气候模型中海冰厚度的模拟,发现模型在中央北极和周边海域存在偏差。使用基于卫星数据的新方法评估海冰厚度,为改进海冰模型提供了观测数据支持。需要进一步调整模型参数以更准确地反映观测数据。

文献阅读(四)

seisamuse
seisamuse · 2024-06-16T15:41:11Z

本文利用卷积神经网络的权重分析来检测模型的偏差。通过玩具例子和性别识别案例研究,发现无需进行模型推理,只需查看权重即可判断模型是否存在偏差。在MNIST模型中,能够以超过99%的准确率检测出强烈或微弱的偏见,并以超过70%的准确率分类四个偏见水平。在面部模型中,实现了90%的准确率来区分针对亚洲人、黑人或白人的有偏见模型。

去偏术者:奇妙的权值及其发现方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-21T00:00:00Z

该研究评估了具有歧视性基础模型的偏差,并对现有的缓解这些模型偏差的方法进行了系统评估。研究者使用公平 PCA 方法进行去偏,发现其在大多数任务的去偏中效果非常好,同时只带来了轻微的性能损失。不同的去偏方法在不同的任务中的有效性有所不同。

评估计算机视觉中的判别基础模型的公平性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-18T00:00:00Z

本文介绍了一种基于模型的强化学习算法USB-PO,通过优化目标统一模型漂移和模型偏差,并制定了一种自适应微调过程,以获得性能改进保证,同时避免模型过拟合。实证结果表明,该算法在几个具有挑战性的基准任务上实现了最先进的性能。

模型基强化学习中解决客观差异的统一视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

本文介绍了一种新的FL算法CA-Fed,平衡收敛速度和模型偏差,忽略可用性低和相关性大的客户。实验结果表明,CA-Fed比现有算法具有更高的时间平均准确性和更低的标准差。

基于元胞自动机的联邦学习智能客户端选择

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-01T00:00:00Z

本文介绍了一种名为USB-PO的基于模型的强化学习算法,通过统一模型漂移和模型偏差,并制定了一种自适应微调过程,以获得性能改进保证,同时避免模型过拟合。实证结果表明,USB-PO在几个具有挑战性的基准任务上实现了最先进的性能。

如何微调模型:统一模型偏移与模型偏差策略优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

本文研究了减轻大型语言模型毒性的策略及其对模型偏差和质量的影响。研究发现,干预策略可以优化自动指标,但会减少对边缘化团体和方言的覆盖率。强减毒干预后,人类评分员通常不同意高自动毒性得分,凸显了评估语言模型毒性的复杂性。

逐步解毒语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-16T00:00:00Z

本文介绍了一种名为LANCE的算法,用于自动化模型应力测试。该算法利用语言引导和文本编辑技术,增加了IID测试集的多样性和挑战性,而不改变模型权重。作者对多个预训练模型进行了测试,发现它们在性能上有显著且一致的下降。此外,作者还分析了不同类型编辑对模型的敏感性,并展示了其在揭示ImageNet中未知类别级别模型偏差方面的应用。

医学图像分类中的鲁棒性压力测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码