小红花·文摘

LlamaParse 更新 2025年5月：新模型、倾斜检测及更多功能

Blog on LlamaIndex ·

电影版Shazam - Clip2Title

DEV Community ·

本文提出了一种新方法，将多类分类器的校准转化为单个二元分类器的校准，以解决神经网络分类模型中置信度评分不准确的问题。实验结果表明，该方法显著提升了校准效率。

多类分类器的置信度校准

BriefGPT - AI 论文速递 ·

本文介绍了一种新方法，结合大型语言模型（LLM）和不确定性感知模块，为生成答案提供置信度评分。研究表明，通过高效微调，LLM在多个基准数据集上超越了现有算法，并提出了一种基于扰动的不确定性估计方法，量化答案的置信度。这一方法在提高模型的准确性和可解释性方面具有重要意义。

基于定向蕴涵图和主张级响应增强的 LLM 不确定性量化

BriefGPT - AI 论文速递 ·

研究人员通过信息增益最大化启发式方法开发了一种增强的主动学习方法，并在真实环境中评估了其有效性。研究发现，高技能的分析员提供标签，并使用置信度评分来估计分析员的标签不确定性，并根据预期信息增益的优先级对实例进行标记是最佳的评估方法。研究还建议在实施主动学习之前对分析员进行筛选和培训，并在早期阶段使用基于专家置信度的信息增益最大化采样方法。

隐私感知主动学习中的最大信息增益策略研究

BriefGPT - AI 论文速递 ·