小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型在指令遵循中是否能够有效估计不确定性?

大型语言模型(LLMs)在遵循用户指令方面存在显著局限性,影响其在高风险应用中的可靠性。我们首次系统评估了LLMs在指令遵循中的不确定性估计能力,发现现有方法在处理细微错误时表现不佳,尽管内部模型状态有所改善,但仍无法应对复杂场景。这些发现为理解LLMs的局限性和不确定性估计提供了重要见解。

大型语言模型在指令遵循中是否能够有效估计不确定性?

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-08T00:00:00Z

本文探讨了弱监督学习在多实例部分标签学习中的可解释性和可靠性问题。通过引入归纳逻辑编程,提出了一种神经符号框架,增强了模型的结构性和学习指导,提高了模型的稳健性和透明度,确保神经网络的预测符合领域知识,适用于高风险应用。

神经符号弱监督:理论与语义

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本研究提出了一种名为STX-搜索的方法,旨在提高高风险应用(如医疗和交通)中时空模型预测的可解释性。该方法通过新颖的搜索策略和目标函数,生成高保真度的实例级解释,优化了解释的可理解性。与现有方法相比,STX-搜索在解释质量和大小上表现更佳。

STX-Search: Explanation Search for Continuous Dynamic Spatio-Temporal Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究探讨了现有人工智能监管框架的局限性,指出传统基准测试无法有效保障AI系统的安全。建议采用双层监管框架,加强对高风险应用的监管,并对低风险使用进行适当的风险沟通。

Beyond Benchmarks: The False Promises of AI Regulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-26T00:00:00Z
大型语言模型在遵循指令时是否能够有效估计不确定性?

本文探讨了大型语言模型(LLMs)在遵循用户指令时的可靠性,指出其在高风险应用中的局限性。研究首次系统评估了LLMs的不确定性估计能力,并提出了受控评估设置以比较不同条件下的不确定性估计方法。结果显示,现有方法在模型细微错误时表现不佳,揭示了LLMs在指令遵循任务中的不足。

大型语言模型在遵循指令时是否能够有效估计不确定性?

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-20T00:00:00Z

本研究提出了一种新的PCP框架,解决了复杂分布和有限样本下覆盖效率不足的问题。通过向量化非顺应性分数和优化预测集形状,显著提高了效率。实验结果表明,该方法在合成和真实数据集上表现优异,特别适用于高风险领域。

Optimizing Probabilistic Conformal Prediction with Vectorized Nonconformity Scores

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文探讨了Shapley值在特征重要性评估中的局限性,指出其在高风险应用中可能导致误导性结果。研究提出了新的框架FAE,结合博弈论和Shapley值,以提高模型的透明度和可信度。此外,提出了基于流形的Shapley方法,以解决传统Shapley在复杂场景中的解释性挑战。

CAGE:因果感知 Shapley 值用于全局解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-17T00:00:00Z

本研究探讨了大型语言模型(LLM)的自信度问题,提出了一种新的置信度估计框架,通过评估多个候选答案的可信度来减轻过度自信。实验结果表明,该框架有效提高了模型的准确性和校准能力,增强了用户对模型输出的信任,尤其在高风险应用中具有重要意义。

通过从过去经验中学习,增强大型语言模型中的自信表达

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-16T00:00:00Z

本文提出了一种有效的边缘计算推理方法,重点在设备模型计算成本与中间特征通信成本的权衡。通过模型拆分、通信感知模型压缩和任务导向特征编码,构建了三步框架,显著降低推理延迟,并探讨了边缘机器学习在高风险应用中的有效性。

通过有向信息瓶颈的神经形态学无线设备边缘协同推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码