本研究提出了一种校准方法(RepCali),有效解决了微调预训练语言模型时编码器与解码器输入差异的问题,显著提升了下游任务的性能。
本研究提出了一种新的直流偏移校准方法和Hilbert差分交叉乘积解调算法,有效解决了复杂环境中生命体征检测的相位解调性能下降问题,显著提高了信号恢复精度。
本研究提出了一种名为CHARM的校准方法,旨在解决奖励模型中的偏差问题,从而提高评估的准确性和与人类偏好的相关性,促进更公平可靠的奖励模型构建。
本研究提出了一种新校准方法,通过在大型语言模型中添加[IDK]标记,明确表达不确定性,从而减少生成文本中的错误预测,并对知识编码的影响较小。
本文探讨了自然语言处理中的语言结构概率分布评估,提出了一种分析校准的方法,并比较了多种模型的误校准情况。研究发现,预训练模型在特定领域的校准性较好,并提出自适应温度缩放等方法以提高校准水平。此外,研究解决了大型语言模型评估中的透明性问题,提出基于发散的校准方法,显著提升了检测性能,推动了科学评估与伦理应用的发展。
该研究提出了一种新型校准方法CRUDE,适用于回归设置,显示出优于现有技术的性能。同时,介绍了空间预测误差剖面和变量重要性剖面作为评估工具,以改善机器学习模型的解释和设计。研究还探讨了地理空间建模中的挑战及其解决方案,强调了人工智能在环境应用中的潜力。
本文探讨了大型语言模型(LLMs)在处理知识冲突时的表现,并提出新的校准方法以提高模型的可信度和一致性。研究发现,LLMs在面对外部知识时容易产生幻觉,并在知识冲突情况下表现出确认偏差。通过分析不同类型的知识冲突,旨在为改善LLMs的鲁棒性提供策略。
本文介绍了几种校准方法,包括焦点损失、温度缩放和参数化温度缩放等,这些方法可以提高分类模型在测试数据上的校准表现,并解决过度自信的问题。实验证明这些方法在多个数据集上都取得了良好的效果。
麻省理工学院和MIT-IBM Watson AI实验室的研究人员引入了一种名为“温度计”的校准方法,用于大型语言模型(LLMs)。该方法通过构建辅助模型来校准LLMs,提高校准响应和效率。温度计可以帮助用户识别模型过于自信的错误预测,并防止在可能失败的情况下部署该模型。研究人员还发现,温度计模型可以直接应用于较大的LLMs。未来,他们计划将温度计应用于更复杂的文本生成任务和更大的LLMs。
本文提出了一种新型标签偏倚校准方法,旨在提高大型语言模型在少样本提示下的性能,并减轻标签偏倚。研究强调了标签偏倚对模型可靠性的影响,并介绍了多种评估和缓解社会偏见的技术,以帮助研究人员理解和防止偏见的传播。
本文分析了分箱策略中的估计偏差,建立了偏差上界以提高收敛速率,并提出了最优箱数。研究扩展了偏差分析至广义化误差,验证了深度学习模型的有效性。同时,探讨了基于PAC-Bayes的随机预测模型的泛化能力及其应用,提出了改进的校准方法,实验证明其优于现有方法。
本文介绍了一种新的市场仿真器校准方法,利用深度学习的最新进展,能够正确识别高概率参数集,无需依赖手动选择或加权的简化事实集合。
本文提出了一种普适的校准方法,用于检测和调整训练过的Transformer模型中的上下文驱动分布变化。实验证明该方法持续增强了当前真实世界数据集上最先进的Transformers的性能,特别是在具有实质性CDS的情况下。
该文介绍了一种对齐的语言模型在多选题设置下多显示过于自信的输出答案的问题,并提出了易于实施且高效的校准方法。作者评估了对齐过程对语言模型的逻辑回归置信度校准的影响。
该文介绍了一种使用未标记数据改进深度集成模型校准的方法,能够在小训练数据情况下获得低负对数似然和高集成的多样性。实验证明,该方法在多样性和校准能力上表现更好。
本文讨论了使用现代神经网络进行多目标检测的方法,考虑了检测方法的不确定性。作者提出了对象定位的精度检测方法,并研究了检测误差的影响。文章还讨论了空间不确定性问题,并介绍了校准方法。最后,作者展示了在车辆自动驾驶等场景中实现定位校准的应用。
神经网络在蒸馏数据上训练时会产生过于自信的输出,需要通过温度标定和混合等校准方法进行修正。本文提出了掩码温度标定和掩码蒸馏训练方法,可以缓解蒸馏数据的限制,实现更好的校准结果,并保持数据集蒸馏的效率。
完成下面两步后,将自动完成登录并继续当前操作。