小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Claude Mythos潜在思维执行任务比OpenAI CoT思维链更强

本文探讨了思维链(CoT)与潜在思维(循环Transformer)的差异。思维链适合透明性高的任务,但效率较低;潜在思维则通过并行计算提高速度,适合复杂任务。两者互补,未来AI应结合这两种能力,以提升效率和探索性。

Claude Mythos潜在思维执行任务比OpenAI CoT思维链更强

极道
极道 · 2026-05-03T09:53:00Z
GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。

GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

结构之法 算法之道
结构之法 算法之道 · 2026-02-14T12:16:31Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

EMNLP 2025 | 动态压缩CoT推理新方法LightThinker来了

机器之心
机器之心 · 2025-08-28T06:12:46Z
基于 CoT 协调多 MCP Tool — 智能运维 Redshift

Amazon Redshift 是一种云数据仓库服务,支持大规模数据分析。结合 Amazon Q Developer CLI 和多个 MCP Tool,优化了运维效率,提升了性能和问题排查能力。通过思维链方法协调任务规划,确保满足用户需求。

基于 CoT 协调多 MCP Tool — 智能运维 Redshift

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-07-30T02:50:13Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

ICCV 2025|UV-CoT:无监督视觉推理新突破,偏好优化重塑图像级思维链

机器之心
机器之心 · 2025-07-28T05:27:00Z
炒冷饭之 LLM 论文: CoT、REACT

本文总结了对几篇大模型(LLM)论文的理解,重点讨论了COT和REACT方法。尽管这些论文发表于2022年,但随着大模型的快速发展,许多示例已不再适用。通过代码验证,展示了COT的推理过程和REACT的工具调用,强调了Prompt设计的重要性。最后,探讨了如何结合推理与工具以提升大模型的输出效果。

炒冷饭之 LLM 论文: CoT、REACT

Ying’s Blog
Ying’s Blog · 2025-07-05T11:42:17Z
LLM Paper&Practice:从 CoT 到 ReAct

本文总结了思维链(CoT)和 ReAct 两种大模型应用范式。CoT 通过逐步推理提升模型在复杂问题上的准确性,而 ReAct 则结合思考与行动,使模型能够与外部世界交互,克服知识过时等问题。这两种方法的演进展示了从封闭知识库到智能代理的转变,强调了推理能力与可控性之间的平衡。

LLM Paper&Practice:从 CoT 到 ReAct

Ying’s Blog
Ying’s Blog · 2025-07-05T11:42:17Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

机器之心
机器之心 · 2025-06-03T06:55:35Z

本研究提出了CoT-Kinetics能量方程,旨在解决大规模推理模型在评估输出质量时忽视推理过程合理性的问题。通过量化推理阶段,提升模型在复杂任务中的推理能力。

CoT-Kinetics: A Theoretical Model for Assessing the Reasoning Process of Large-Scale Reasoning Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究针对大型推理模型(LRMs)面临的全面CoT数据集缺乏的问题,提出了OmniThought,一个包含200万条CoT过程的数据集,经过两个强大的LRMs验证生成。每个CoT过程被标注了新的推理丰富性(RV)和认知难度(CD)评分,显著提升了LRMs在复杂任务训练中的有效性,进而推动了LRMs的开发和训练。

使用OmniThought进行推理:一个具有丰富性和认知难度注释的大型CoT数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

机器之心
机器之心 · 2025-05-12T05:12:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

机器之心
机器之心 · 2025-05-12T05:08:53Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升

机器之心
机器之心 · 2025-05-05T10:35:27Z

本研究解决了大语言模型在复杂任务中推理链的生成可靠性低和自然语言推理链干扰推理逻辑的主要问题。提出的新框架CoT-RAG通过知识图谱驱动的推理链生成、可学习的知识案例感知检索增强生成和伪程序提示执行,显著提升了推理准确性,且在多个数据集上表现出强大的实际应用价值和可扩展性。

CoT-RAG: 将思维链和检索增强生成整合以提升大语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-18T00:00:00Z

本研究提出了一种新方法,通过自适应问题难度生成高质量链式思维(CoT)数据,以解决大型语言模型在复杂任务中的推理能力不均衡问题。该方法显著降低了数据生成成本,提高了模型微调效率,并在数学竞赛和代码生成领域验证了其有效性。

Rethinking the Generation of High-Quality CoT Data from the Perspective of LLM-Adaptive Question Difficulty Grading

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本研究提出了PRIMEDrive-CoT框架,旨在解决自驾模型在不确定性场景中的不足。该框架结合激光雷达与多视角RGB信息,通过贝叶斯图神经网络实现目标交互的概率推理,提升了场景理解的可解释性与可靠性。研究结果表明,PRIMEDrive-CoT在DriveCoT数据集上优于现有模型,展示了在复杂环境中处理不确定性的潜力。

PRIMEDrive-CoT: A Precognitive Chain-of-Thought Framework for Uncertainty-Aware Object Interaction in Driving Scenarios

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本研究针对现有视觉-语言-动作模型在复杂操作任务中缺乏推理能力的问题,提出了一种将显式视觉链思维推理(CoT)融入模型的新方法。通过预测未来图像帧作为视觉目标并生成短的动作序列,CoT-VLA实现了在现实操作任务中相较于最先进模型提高了17%的性能,展现出显著的影响力。

CoT-VLA: 视觉链思维推理的视觉-语言-动作模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z
揭示显式CoT训练机制:思维链如何增强推理泛化能力

基于思维链训练的大语言模型显著提升了推理的泛化能力,适用于内外部场景。研究表明数据分布的关键因素影响模型的系统性泛化,并在噪声数据下保持鲁棒性,为模型调优策略提供了重要见解。

揭示显式CoT训练机制:思维链如何增强推理泛化能力

机器之心
机器之心 · 2025-03-12T02:14:46Z

本研究提出CoT-Drive,通过大型语言模型和链式思维提示,提升自动驾驶中的运动预测准确性。采用知识蒸馏策略,将场景理解能力转移至轻量级模型,实现实时操作,显著增强复杂交通环境中的预测准确性和鲁棒性。

CoT-Drive: 利用大型语言模型和链式思维提示进行高效的自动驾驶运动预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
CoT推理模型——2025年哪一个称王?

对o3-Mini-High、Claude Sonnet 3.7、Grok 3 Think和Deep Seek R1进行比较,Grok 3在数学和编码任务中表现最佳,Claude Sonnet 3.7在推理和写作方面表现突出。选择合适的模型需根据具体需求。

CoT推理模型——2025年哪一个称王?

DEV Community
DEV Community · 2025-03-09T12:32:44Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码