小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究评估了多个大型语言模型在回答300个胃肠病学问题时的自我报告反应确定性。尽管新模型表现较好,但普遍存在过度自信的倾向,这对医疗健康中安全使用大型语言模型提出了挑战。

Self-Reported Confidence of Large Language Models in Gastroenterology: An Analysis of Commercial, Open-Source, and Quantized Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本文提出了一种新方法InpDiffusion,旨在解决图像修复定位中的过度自信和边界检测困难问题。通过引入边缘条件和监督策略,提升了修复图像的细节感知,显著提高了定位的准确性和鲁棒性。

InpDiffusion: Image Inpainting Localization via Conditional Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z
我眼中的人工智能

随着人工智能的发展,许多非程序员获得了初学者的成就感,但对代码本质缺乏理解,可能导致过度自信和错误决策。开发者应利用AI展示复杂应用,同时关注技术伦理问题。

我眼中的人工智能

DEV Community
DEV Community · 2024-11-09T17:00:47Z

本文介绍了几种校准方法,包括焦点损失、温度缩放和参数化温度缩放等,这些方法可以提高分类模型在测试数据上的校准表现,并解决过度自信的问题。实验证明这些方法在多个数据集上都取得了良好的效果。

通过关联焦点损失、温度缩放和适当性来改善校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本研究针对深度神经网络分类器的过度自信预测问题,提出了K+1路softmax公式和基于能量的目标函数,以改进开放世界中的OOD检测。通过引入辅助样本和伪样本,提升了模型在领域漂移下的可靠性和校准性,实验结果表明该方法在OOD检测上优于现有技术,具有较高的可信度。

野外数据集中的基于能量的实例尺度调整的不确定性校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

本文提出了一种基于自动编码器的新方法,通过生成接近真实数据的数据集,改善深度神经网络的性能,解决过度自信问题。该方法在时间序列和MNIST数据集上取得成功,并验证了其在自动驾驶轨迹预测中的有效性。

基于自编码器的消除伪相关性方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码