小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
通过信心标记学习路由大型语言模型

大型语言模型(LLMs)在多种任务中表现优异,但在高风险环境中,了解其输出的可靠性至关重要。本文探讨了LLMs如何有效表达答案的信心,并提出了一种轻量级训练策略Self-REF,通过引入信心标记来提升答案准确性。研究表明,信心标记显著改善了后续任务中的路由和拒绝学习效果。

通过信心标记学习路由大型语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-07T00:00:00Z

RAG(检索增强生成)系统通过上下文压缩技术提高检索效率和答案准确性。上下文压缩包括选择性保留、摘要和句子抽取三种方式,能有效减少无关信息。通过预处理、向量化、压缩和生成答案,RAG系统优化文档处理,节省内存并加快推理速度。

爆改RAG!用“上下文压缩”让你的AI检索系统又快又准

dotNET跨平台
dotNET跨平台 · 2025-07-01T00:04:57Z

本研究质疑大语言模型对最终答案的依赖,提出通过分析中间推理步骤来提高答案准确性,实验验证了该方法在多个模型和数学推理数据集上的有效性。

Beyond the Final Answer: Your Reasoning Path Reveals More

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究分析了大型语言模型(LLM)在多跳问题回答中的解码方法,提出结合ReAct框架与解码策略以提高答案准确性,特别是在推理和外部知识获取方面,解决了因事实不准确导致的“幻觉”现象。

An Analysis of Decoding Methods for Multi-Hop Question Answering Based on Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究提出了FANS框架,旨在解决大语言模型在自然语言数学推理中的不足。通过将数学问题转化为Lean4定理并验证答案,显著提高了答案选择的准确性。

FANS - 基于 Lean4 的自然语言数学推理的形式答案选择

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z

本研究提出了一种新型的RAG系统,通过引入评估模块,提高了在大数据环境下的答案准确性和效率,为高精度问答应用奠定了基础。

检索增强生成中的语义标记

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

最近的大型语言模型 (LLMs) 的进展使得思维链 (CoT) 提醒的紧急能力增加。为了设计 LLM 提示,有一个重要的设置,称为演示选择。我们介绍了一种新方法,称为推理技能发现 (RSD),它使用无监督学习创建合理性的潜在空间表示,同时学习一个推理策略来确定给定问题所需的推理技能。RSD 在多个推理任务中的答案准确性方面优于现有方法多达 6%。

代码提示引发了文本 + 代码模型的条件推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码