小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种推理一致性评估指标,分析大型语言模型在高中数学新问题上的推理能力。研究发现,推理步骤增多时,模型的准确率显著下降,主要问题在于推导结论的能力,而理解输入前提的能力相对稳定。

Deductive Consistency: A Framework for Evaluating Reasoning in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究探讨了过程奖励模型(PRMs)在应对分布外挑战时的问题,提出了一种增强检索过程奖励模型(RetrievalPRM),通过两阶段检索机制提高了模型的通用性和推理一致性,实验结果表明其在多个真实数据集上表现优异。

增强检索过程奖励模型用于可推广的数学推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出了一种生成命题集的算法,解决了人工智能推理一致性的问题。研究表明,大型语言模型能够有效重建一致性图,推动机器认知技术的发展。

通过大型语言模型和一致性驱动推理实现的神经符号人工智能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码