小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
自适应思维:大型语言模型何时在潜在空间中思考

大型语言模型(LLMs)在推理中引入了中间思维链(CoT)能力。研究表明,自一致性可作为思维必要性的指标,较低的一致性表明查询需要更多思考。基于此,提出了Sonata方法,能够自适应分配思维预算,优化性能与效率的平衡。实验结果显示,Sonata在保持准确率的同时,思维令牌减少20%至80%。

自适应思维:大型语言模型何时在潜在空间中思考

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-29T00:00:00Z
推理模型难以控制其思维链,这其实是件好事

随着AI代理执行复杂任务,监控其行为变得至关重要。研究表明,当前推理模型在控制思维链方面能力不足,尽管模型规模增大可提高可控性,但长时间推理会降低其效果。因此,思维链的监控变得更加可靠,未来需持续评估以确保安全。

推理模型难以控制其思维链,这其实是件好事

OpenAI
OpenAI · 2026-03-05T10:00:00Z
两天烧掉200美元!我AI大模型网关终于支持了Claude模型

Chats 1.9.0版本于2025年发布,全面支持Anthropic Claude模型,提升API兼容性。开发者在Azure测试时产生高额费用,但成功集成Claude模型,优化思维链和签名验证,增强API管理和视觉能力,标志着Chats向通用AI基础设施的进化。

两天烧掉200美元!我AI大模型网关终于支持了Claude模型

dotNET跨平台
dotNET跨平台 · 2026-01-22T00:01:42Z
Redis 之父 Salvatore Sanfilippo 的年终 AI 反思

Redis 创始人 Salvatore Sanfilippo 对 AI 发展进行了反思,提出八个观点。他认为大语言模型(LLM)已超越“随机鹦鹉”的阶段,思维链和强化学习推动了模型能力的提升。程序员对 AI 的态度发生了变化,尽管 LLM 的架构未变,但其能力已显著增强。未来 AI 面临的挑战在于如何避免潜在风险。

Redis 之父 Salvatore Sanfilippo 的年终 AI 反思

宝玉的分享
宝玉的分享 · 2025-12-20T19:47:53Z
全球首个“通用科研智能体”SciMaster发布

上海交通大学与深势科技联合推出了通用科研智能体SciMaster,具备“读、算、做”能力,能够生成深度调研报告。SciMaster通过多种检索方式分析科学问题,支持思维链编辑,重塑高校科研模式,已与40余所高校合作。

全球首个“通用科研智能体”SciMaster发布

全球TMT-美通国际
全球TMT-美通国际 · 2025-07-28T02:31:08Z

斯坦福大学的Denny Zhou教授强调了大模型推理的重要性,指出中间推理步骤可以提高模型的准确性和自信心。他提出通过思维链和强化学习微调等方法,增强大语言模型的推理能力,以解决复杂问题。

斯坦福大模型推理课免费了,谷歌推理团队创始人主讲

量子位
量子位 · 2025-07-25T08:25:36Z
LLM Paper&Practice:从 CoT 到 ReAct

本文总结了思维链(CoT)和 ReAct 两种大模型应用范式。CoT 通过逐步推理提升模型在复杂问题上的准确性,而 ReAct 则结合思考与行动,使模型能够与外部世界交互,克服知识过时等问题。这两种方法的演进展示了从封闭知识库到智能代理的转变,强调了推理能力与可控性之间的平衡。

LLM Paper&Practice:从 CoT 到 ReAct

Ying’s Blog
Ying’s Blog · 2025-07-05T11:42:17Z
新版DeepSeek-R1模型上线,实测用它做一个端午节赛龙舟小游戏

DeepSeek R1模型完成小版本升级,参数从671B增至685B,用户反馈思维链和代码能力显著提升,生成的代码清晰可运行。但仍存在AI幻觉问题,需谨慎核查内容。

新版DeepSeek-R1模型上线,实测用它做一个端午节赛龙舟小游戏

TechWeb 全站精华
TechWeb 全站精华 · 2025-05-29T05:41:21Z

多模态大模型在视觉推理能力评估中表现不佳,o3仅为25.8%,远低于人类的82.3%。新基准测试RBench-V揭示了模型在图像生成和理解方面的不足,强调了改进方向,如多模态思维链等新方法。

多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3% | 清华腾讯斯坦福联合

量子位
量子位 · 2025-05-28T04:38:46Z
探索大型多模态模型在视频理解中的幻觉:基准、分析与缓解

香港城市大学的Gao等人研究了视频理解中的幻觉,分为三类:与先前知识冲突、上下文冲突和能力不足。提出了一种有效的微调数据集方法,通过思维链生成视频对和答案。

探索大型多模态模型在视频理解中的幻觉:基准、分析与缓解

DEV Community
DEV Community · 2025-05-25T00:57:49Z

本研究提出了一种思维链跃迁桥接任务,以解决大型语言模型在数学任务中因缺失中间步骤而导致的思维跃迁问题。实验结果显示,经过微调的模型在数学推理基准上的表现提升最高可达5.87%。

Bridging the Gap: Mitigating Thought Jumps to Enhance Chain-of-Thought Fine-Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

翁荔在《Why We Think》中探讨了“测试时计算”和“思维链”如何提升人工智能模型性能。他指出,通过让模型在输出前进行更多思考,可以突破能力瓶颈,并借鉴人类思维过程。文章提出优化计算资源和引入潜变量建模等方法,以增强推理能力,同时讨论了并行采样与顺序修订的结合使用,以提高模型的准确性和自我修正能力。

翁荔最新万字长文:Why We Think

量子位
量子位 · 2025-05-18T05:41:39Z

本文提出了一种结合思维链与检索增强生成的方法,以解决大型语言模型在复杂任务中产生虚假信息的问题。研究表明,外部知识和自我验证策略的引入显著提升了模型的响应质量和推理深度。

Enhancing the Reliability of Large Language Models: Integrating Chain of Thought, Retrieval-Augmented Generation, Self-Consistency, and Self-Verification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
我们为何思考

本文探讨了延长模型思考时间和思维链(CoT)对提升模型性能的重要性。研究表明,适当的计算资源和思维过程能显著增强推理能力,尤其在数学和编程任务中。未来研究应关注优化模型的自我纠错能力和思维过程的可解释性。

我们为何思考

Lil'Log
Lil'Log · 2025-05-01T00:00:00Z
解锁复杂推理:OpenAI的O1和O3模型如何运作

OpenAI的O1和O3模型采用“思维链”方法,逐步解决复杂问题,模仿人类思维。这种方法有助于识别错误、调整策略,提高准确性,广泛应用于教育、客户支持和内容创作等领域。

解锁复杂推理:OpenAI的O1和O3模型如何运作

DEV Community
DEV Community · 2025-04-25T13:28:24Z
推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确

加州大学伯克利分校与艾伦人工智能研究所提出的NoThinking方法表明,推理模型无需显式思维链即可高效推理。研究显示,NoThinking在token使用量上比传统Thinking方法少3.3-5.1倍,并且在低预算情况下表现更佳,挑战了冗长思考过程的必要性。

推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确

机器之心
机器之心 · 2025-04-20T02:24:36Z
从零开始构建思维链 - 小白教程

本文介绍了如何通过“思维链”方法教AI逐步解决问题。AI常常直接给出错误答案,原因在于缺乏逐步思考。通过PocketFlow框架,用户可以构建思维链系统,使AI像侦探一样分析问题、制定计划、执行步骤并评估结果。该方法强调计划、执行、评估和更新的循环,帮助AI更好地理解和解决复杂问题。

从零开始构建思维链 - 小白教程

DEV Community
DEV Community · 2025-04-16T04:28:31Z
DeepSeek-R1 API:推动人工智能发展的新力量

DeepSeek-R1是一款开源推理模型,专注于密集推理任务,表现优异。它采用思维链技术和模型蒸馏,提升了推理能力,适用于多种文本处理任务,为开发者提供强大支持,推动人工智能发展。

DeepSeek-R1 API:推动人工智能发展的新力量

APISpace
APISpace · 2025-04-02T05:50:46Z

本研究探讨了大型语言模型在贝叶斯推理中的解释策略,发现思维链对生态有效策略反应不足,存在符号推理偏倚。这对改进机器学习辅助学习方法具有重要意义。

Do Large Language Models' Thinking Chains Suffer from Hallucinations, Cognitive Biases, or Fears in Bayesian Reasoning?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
AI进入推理模型时代,一文带你读懂思维链

DeepSeek R1模型在AI领域备受关注,其思维链(CoT)技术通过逐步推理提高答案的准确性。自2022年提出以来,CoT已被多项研究验证,显示较大模型在使用CoT时表现更佳,但对简单问题效果有限。新技术如思维树(ToT)和自我一致性思维链(CoT-SC)进一步优化推理过程。尽管高级推理方法成本较高,但在确保答案正确性方面具有重要价值。

AI进入推理模型时代,一文带你读懂思维链

机器之心
机器之心 · 2025-03-15T15:52:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码