小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种创新的框架,将大型语言模型(LLMs)与外部思考器模块相结合,以增强基于LLM的代理机构的推理能力。该框架形成了一个推理层次结构,其中LLMs处理直觉性的System-1任务,而思考器专注于需要复杂逻辑分析和领域特定知识的认知System-2任务。实验证明了该框架在演绎推理、语音生成和在线游戏评估方面的有效性。此外,通过与思考器集成来调优6B LLM,以超越GPT4。本文还贡献了迄今为止最大的社交推理游戏数据集。

通过情境分析和说服策略增强狼人游戏中的对话生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z

本文研究了大型语言模型在推理能力上的差异,发现在归纳推理方面表现优异,但在演绎推理中相对不足。这一发现为进一步研究提供了新的视角和方向。

项目SHADOW:基于LM探测的Wikidata符号高阶关联推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

大型语言模型(LLMs)的发展引起了人们对其推理和问题解决能力的兴趣。研究发现,LLMs在解决演绎推理问题上能力有限,无论改变展示格式和内容,模型性能都未提高。总的来说,LLMs具有独特的推理偏见,只能部分预测人类的推理表现。

Case2Code:利用合成数据学习归纳推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

大型语言模型(LLMs)的发展引起了人们对其推理和问题解决能力的兴趣。研究发现,LLMs在解决演绎推理问题上能力有限,无论改变展示格式和内容,模型性能都未提高。总的来说,LLMs具有独特的推理偏见,只能部分预测人类的推理表现。

大型语言模型是否能理解 DL-Lite 本体?一项实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

大型语言模型(LLMs)的发展引起了人们对其推理和问题解决能力的兴趣。研究发现,LLMs在解决演绎推理问题上能力有限,无论改变展示格式和内容,模型性能都未提高。总的来说,LLMs具有独特的推理偏见,只能部分预测人类的推理表现。

大型语言模型在组合性关系推理中的限制探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

大型语言模型(LLMs)的发展引起了人们对其推理和问题解决能力的兴趣。研究发现,LLMs在解决经典演绎推理问题上能力有限,改变展示格式和内容不能改善模型性能。LLMs具有独特的推理偏见,只能部分预测人类的推理表现。

LLMs 是否能够推理计算?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

研究人员成功将现代AI模型与几何形式系统整合,建立了一个完整且兼容的平面几何形式系统。他们提出了几何形式化理论(GFT),构建了包含88个几何谓词和196个定理的形式系统,并开发了形式几何问题解决器(FGPS)。实验证明GFT的正确性和实用性。

FGeo-DRL:通过深度增强学习进行几何问题的演绎推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

大型语言模型(LLMs)的发展引起了人们对其推理和问题解决能力的兴趣。研究发现,LLMs在解决演绎推理问题上能力有限,无论改变展示格式和内容,模型性能都未提高。总的来说,LLMs具有独特的推理偏见,只能部分预测人类的推理表现。

大型语言模型推理中前提顺序重要性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

本文提出了一种创新的框架,将大型语言模型(LLMs)与外部思考器模块相结合,以增强基于 LLM 的代理机构的推理能力。该框架形成了一个推理层次结构,其中 LLMs 处理直觉性的 System-1 任务,而思考器专注于需要复杂逻辑分析和领域特定知识的认知 System-2 任务。实验证明了该框架在演绎推理、语音生成和在线游戏评估方面的有效性。此外,我们通过与思考器集成来调优 6B LLM,以超越 GPT4。本文还贡献了迄今为止最大的社交推理游戏数据集。

提升大规模语言模型在狼人杀游戏中的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-04T00:00:00Z

本论文研究了演绎推理中的胜于推理论据,利用GPT-3.5-turbo自动化分析这些论据,并生成清晰连贯的解释和新颖的论据。外部信息整合提高了解释质量,突出了人工智能在复杂推理任务中的潜力。

逻辑推理解释生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-22T00:00:00Z

本研究测试了几种大型语言模型(LLMs)在解决认知科学文献中的演绎推理问题方面的能力。结果显示,这些模型的传统形式上的解决能力有限,且具有独特的推理偏见。更改展示格式和内容并不能改善模型性能。

评估逐步推理与词汇否定:一个对三段论的案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

本研究测试了几种大型语言模型(LLMs)在解决认知科学文献中的演绎推理问题方面的能力。结果表明,LLMs在传统形式上解决这些问题的能力有限,且具有推理偏见。后续实验未能提高总体性能。

简洁有序的感知促进大型语言模型进行演绎推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-05T00:00:00Z

研究探讨了LLMs解决认知科学文献中演绎推理问题的能力。研究发现LLMs在传统形式上解决这些问题的能力有限,且具有推理偏见。后续实验未能提高总体性能。

评估大型语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码