小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种校准方法(RepCali),有效解决了微调预训练语言模型时编码器与解码器输入差异的问题,显著提升了下游任务的性能。

RepCali:通过潜在空间中的表示校准实现高效微调的预训练语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种新的直流偏移校准方法和Hilbert差分交叉乘积解调算法,有效解决了复杂环境中生命体征检测的相位解调性能下降问题,显著提高了信号恢复精度。

Non-contact Vital Sign Detection in Dynamic Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种名为CHARM的校准方法,旨在解决奖励模型中的偏差问题,从而提高评估的准确性和与人类偏好的相关性,促进更公平可靠的奖励模型构建。

CHARM: Calibrating Reward Models Using Chatbot Arena Scores

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究提出了一种新校准方法,通过在大型语言模型中添加[IDK]标记,明确表达不确定性,从而减少生成文本中的错误预测,并对知识编码的影响较小。

I Don't Know: Explicit Modeling of Uncertainty Using the [IDK] Token

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本文探讨了自然语言处理中的语言结构概率分布评估,提出了一种分析校准的方法,并比较了多种模型的误校准情况。研究发现,预训练模型在特定领域的校准性较好,并提出自适应温度缩放等方法以提高校准水平。此外,研究解决了大型语言模型评估中的透明性问题,提出基于发散的校准方法,显著提升了检测性能,推动了科学评估与伦理应用的发展。

Calibrating Verbal Probabilities for Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

该研究提出了一种新型校准方法CRUDE,适用于回归设置,显示出优于现有技术的性能。同时,介绍了空间预测误差剖面和变量重要性剖面作为评估工具,以改善机器学习模型的解释和设计。研究还探讨了地理空间建模中的挑战及其解决方案,强调了人工智能在环境应用中的潜力。

一种高效的模型无关方法用于数据受限的土壤特性不确定性估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本文探讨了大型语言模型(LLMs)在处理知识冲突时的表现,并提出新的校准方法以提高模型的可信度和一致性。研究发现,LLMs在面对外部知识时容易产生幻觉,并在知识冲突情况下表现出确认偏差。通过分析不同类型的知识冲突,旨在为改善LLMs的鲁棒性提供策略。

冲突库:评估知识冲突对大语言模型影响的基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文介绍了几种校准方法,包括焦点损失、温度缩放和参数化温度缩放等,这些方法可以提高分类模型在测试数据上的校准表现,并解决过度自信的问题。实验证明这些方法在多个数据集上都取得了良好的效果。

通过关联焦点损失、温度缩放和适当性来改善校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z
防止AI模型对错误答案过于自信的方法

麻省理工学院和MIT-IBM Watson AI实验室的研究人员引入了一种名为“温度计”的校准方法,用于大型语言模型(LLMs)。该方法通过构建辅助模型来校准LLMs,提高校准响应和效率。温度计可以帮助用户识别模型过于自信的错误预测,并防止在可能失败的情况下部署该模型。研究人员还发现,温度计模型可以直接应用于较大的LLMs。未来,他们计划将温度计应用于更复杂的文本生成任务和更大的LLMs。

防止AI模型对错误答案过于自信的方法

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2024-07-31T04:00:00Z

本文提出了一种新型标签偏倚校准方法,旨在提高大型语言模型在少样本提示下的性能,并减轻标签偏倚。研究强调了标签偏倚对模型可靠性的影响,并介绍了多种评估和缓解社会偏见的技术,以帮助研究人员理解和防止偏见的传播。

OffsetBias:借助去偏置数据对评估程序进行调优

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文分析了分箱策略中的估计偏差,建立了偏差上界以提高收敛速率,并提出了最优箱数。研究扩展了偏差分析至广义化误差,验证了深度学习模型的有效性。同时,探讨了基于PAC-Bayes的随机预测模型的泛化能力及其应用,提出了改进的校准方法,实验证明其优于现有方法。

分类中的重新校准的 PAC-Bayes 分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

本文介绍了一种新的市场仿真器校准方法,利用深度学习的最新进展,能够正确识别高概率参数集,无需依赖手动选择或加权的简化事实集合。

利用神经密度估计器和嵌入网络进行市场模拟的深度校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

本文提出了一种普适的校准方法,用于检测和调整训练过的Transformer模型中的上下文驱动分布变化。实验证明该方法持续增强了当前真实世界数据集上最先进的Transformers的性能,特别是在具有实质性CDS的情况下。

时序预测变压器的校准:检测和适应基于情境的分布偏移

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

该文介绍了一种对齐的语言模型在多选题设置下多显示过于自信的输出答案的问题,并提出了易于实施且高效的校准方法。作者评估了对齐过程对语言模型的逻辑回归置信度校准的影响。

研究多选设置下对齐语言模型的不确定性校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-18T00:00:00Z

该文介绍了一种使用未标记数据改进深度集成模型校准的方法,能够在小训练数据情况下获得低负对数似然和高集成的多样性。实验证明,该方法在多样性和校准能力上表现更好。

给予非标记数据的几乎免费提升:改进深度集成校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-04T00:00:00Z

本文讨论了使用现代神经网络进行多目标检测的方法,考虑了检测方法的不确定性。作者提出了对象定位的精度检测方法,并研究了检测误差的影响。文章还讨论了空间不确定性问题,并介绍了校准方法。最后,作者展示了在车辆自动驾驶等场景中实现定位校准的应用。

评估目标检测中的不确定性校准的理论和实践框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-01T00:00:00Z

神经网络在蒸馏数据上训练时会产生过于自信的输出,需要通过温度标定和混合等校准方法进行修正。本文提出了掩码温度标定和掩码蒸馏训练方法,可以缓解蒸馏数据的限制,实现更好的校准结果,并保持数据集蒸馏的效率。

长尾识别的双通道温度缩放校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码