小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种能量结果奖励模型(EORM),旨在解决大型语言模型在数学推理中的多步骤逻辑一致性问题。EORM通过使用结果标签简化训练,显著提高了答案的准确性,并在数学基准测试中表现优异。

Learning Chain-of-Thought Ranking: An Energy-Based Result Supervision Method

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了一种自动生成基于上下文的问答对的方法,旨在提升大型语言模型在复杂推理和实时知识整合方面的能力。实验结果显示,该方法在逻辑一致性和事实准确性上优于传统的人类标注问答对。

Automatic Dataset Generation for Knowledge-Intensive Question Answering Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了TrustGeoGen,一个可扩展的正式验证数据引擎,旨在解决几何问题求解中的不足。该引擎通过多模态对齐生成和形式验证,显著提高了模型的逻辑一致性和泛化能力。

TrustGeoGen: A Scalable and Formally Verified Data Engine for Reliable Multi-modal Geometric Problem Solving

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z
人工智能与披萨:语言模型能否准确接单而不出错?

大型语言模型(LLMs)在自然语言处理上表现优异,但在特定任务(如点披萨)时常出现逻辑顺序问题。LivinGrimoire设计模式通过启发式算法提升任务效率和逻辑一致性,弥补LLMs的不足,展现未来AGI设计的潜力。

人工智能与披萨:语言模型能否准确接单而不出错?

DEV Community
DEV Community · 2025-04-01T22:35:53Z

本研究探讨了大型语言模型在处理复杂问题时的推理努力,发现推理努力与问题规模呈正相关,但在超出某一复杂性阈值后可能会减少,揭示了模型在逻辑一致性方面的限制。

Reasoning Effort and Problem Complexity: A Scale Analysis of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出DeFine数据集,旨在解决长篇文章生成中的逻辑一致性、话题覆盖和叙述连贯性问题。通过层次分解和多层级注释,DeFine整合领域知识,提升文本质量和信息深度。

DeFine: A Decomposed and Fine-Grained Annotated Dataset for Long-form Article Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出了“CoVer”框架,利用小型语言模型(SLM)进行逻辑一致性验证,以降低对大型语言模型(LLM)的依赖,并提升社交媒体立场检测的性能。

通过小-大语言模型一致性验证的协作立场检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z

本研究提出了一种新框架,通过事件驱动的文本生成代码和循环训练,显著提升了大语言模型的逻辑一致性,减少了不一致幻觉问题。

MIH-TCCT:通过事件驱动的文本-代码循环训练减轻大语言模型中的不一致幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究提出一种结合强化学习的新框架,以解决大型语言模型生成文本时的逻辑一致性和结构连贯性问题。实验结果表明,该方法在文本连贯性和语义对齐方面显著优于基线模型。

用于逻辑结构语言生成的神经上下文强化框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z
如何通过提示工程为AI代理添加推理能力

本文探讨了AI代理架构中的提示策略如何提升推理能力。有效的提示工程技术包括逐步分解、明确格式指令、自我反思提示和上下文框架。这些策略帮助大型语言模型更系统地处理复杂任务,确保逻辑一致性和透明性。通过不同的推理策略(如ReAct、Chain of Thought和Reflection),代理能够更好地解决问题并进行自我审查,增强了问题解决的灵活性和透明度。

如何通过提示工程为AI代理添加推理能力

The New Stack
The New Stack · 2024-11-20T15:08:02Z

姚期智团队提出思维图(DoT)推理框架,通过拓扑斯理论确保AI逻辑一致性。DoT将推理过程建模为单一模型内的有向无环图(DAG),简化训练和部署。框架包括提议者、批评者和总结者角色,利用自然语言批评提供反馈,捕捉人类推理复杂性。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

量子位
量子位 · 2024-09-24T03:53:47Z

本文讨论了微服务架构中的问题,指出过于细分导致业务逻辑被忽视。作者提出了使用DDD聚合根的概念来解决这个问题,并强调了逻辑一致性的重要性。文章还讨论了上下文的概念和符号推理的能力,强调了符号推理在创新发展中的重要性。

幽默:没有逻辑约束的微服务

极道
极道 · 2023-08-17T01:49:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码