小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章探讨了大模型的使用成本,特别是输入、输出和缓存的费用。模型越大,能力越强,价格越高。推理过程分为预填充和解码,前者并行处理,后者逐个生成,导致计算量非线性增长。通过缓存技术可以降低重复计算成本,有效的上下文管理和明确的需求描述有助于节省Token,提升使用效率。

LLM Token 消耗节省计划

范叶亮的博客
范叶亮的博客 · 2026-04-25T00:00:00Z
代理可观察性推动代理评估

代理的可观察性与传统软件不同,因其行为复杂且不确定。评估代理时应关注推理过程而非代码路径,利用运行、追踪和线程等方法捕捉其行为。生产环境是主要的学习来源,真实数据有助于发现问题并指导测试。

代理可观察性推动代理评估

LangChain Blog
LangChain Blog · 2026-02-22T03:51:44Z

Meta与多所大学合作提出了一种元认知复用机制,通过回顾推理过程提炼简洁的“行为”,显著减少推理token使用量,最多可减少46%。该方法在数学测试中保持准确率不变,提升了模型的推理效率。

推理token减少46%!Meta新方法缩短思维链,告别重复推导

量子位
量子位 · 2025-10-05T08:59:54Z
思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z

自定义后端允许用户编写推理过程,整合多个模型的逻辑判断,简化调用流程,降低HTTP传输延迟。

【Triton 教程】triton_language.permute

HyperAI超神经
HyperAI超神经 · 2025-09-21T12:05:59Z
Anthropic开源工具追踪大型语言模型的“思维”

Anthropic研究人员开源了一款工具,用于追踪大型语言模型的推理过程。该工具包括一个Python库和图形前端,通过替换模型神经元,利用稀疏激活特征生成归因图,揭示模型内部计算步骤,从而提高LLM的可解释性。

Anthropic开源工具追踪大型语言模型的“思维”

InfoQ
InfoQ · 2025-06-08T17:00:00Z
揭示大型语言模型的内部机制:人工智能洞察

Anthropic的研究通过“AI显微镜”分析大型语言模型(LLMs)的内部机制,揭示其如何将可解释概念与计算电路连接。研究表明,Claude在生成语言前会考虑潜在词汇,并采用独特策略解决数学问题。此外,Claude的推理过程常与其内部机制不符,显示LLMs可能会虚构合理化解释。这些发现对依赖自动推理的行业具有重要意义。

揭示大型语言模型的内部机制:人工智能洞察

DEV Community
DEV Community · 2025-04-14T07:00:29Z

本研究提出了一种新方法——携带视觉条件(TVC),旨在解决多模态任务中视觉信息关注度下降的问题。TVC策略优化了推理过程中的视觉输入使用,提升了多模态推理系统的表现,平均性能提高了3.4%。

Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long Chain Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
DeepAI:为任意AI模型增加强化思考链

DeepAI 是一个代理服务器,通过“思考链”增强大型语言模型的交互体验。它接收 OpenAI API 请求,生成推理过程并转发给 LLM,从而提供更具洞察力的回答。支持灵活的后端、流式响应和详细日志记录。

DeepAI:为任意AI模型增加强化思考链

苍穹の下
苍穹の下 · 2025-03-14T02:18:00Z
长链推理表象下,大模型精细表征张冠李戴的本质

近年来,大模型迅速发展,但其决策逻辑与人类认知存在差距,导致信任问题。研究显示,法律大模型常常错误关联无关信息,带来伦理风险。通过构建交互理论,研究者揭示了大模型决策的混乱性,强调推理过程的公平性与可靠性的重要性。

长链推理表象下,大模型精细表征张冠李戴的本质

机器之心
机器之心 · 2025-03-13T03:00:24Z

本研究提出了ReasonGraph网络平台,旨在可视化和分析大型语言模型的推理过程,以降低认知负担、提高错误检测并促进有效开发。

ReasonGraph: 可视化推理路径

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z
深入探讨Llama3:揭示详细见解与实现

该项目从零实现Meta的Llama3,揭示大型语言模型的内部工作原理。提供双语代码注释、维度跟踪和KV-Cache推导,适合初学者和开发者,帮助深入理解模型设计与推理过程。

深入探讨Llama3:揭示详细见解与实现

DEV Community
DEV Community · 2025-02-22T19:48:54Z

本研究提出了一种基于自由论辩的图像分类器解释方法,旨在提高深度学习模型的透明度。通过代理之间的辩论,该方法能够更准确地反映分类器的推理过程,其评估结果优于传统的解释方法。

A Method for Explaining Image Classifiers Based on Free Argumentative Exchanges

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究提出了CopySpec技术,旨在提高大型语言模型生成相似响应的效率。该方法通过识别聊天历史中的重复序列,推测后续标记,实现无损复制,显著加速推理过程,最高提升达2.35倍,尤其在大上下文中表现优异。

CopySpec: Accelerating Large Language Models with Speculative Copy-and-Paste Without Compromising Quality

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究探讨了语言模型在数学问题求解中的假阳性现象,提出了一种新检查方法,揭示了假阳性对推理过程和时间的影响,提醒研究者需谨慎对待。

Examining False Positives in Mathematical Reasoning Under Extended Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z
在Ruby中构建一个微型语言模型(LLM):逐步指南 - V3 "将推理整合到微型LLM中"

本文探讨了在马尔可夫链模型中引入推理过程以生成“思维链”。通过生成中间步骤,模型能够更有效地解决复杂任务。文章描述了如何扩展马尔可夫链类,增加推理生成和最终输出生成的方法,并讨论了该方法的局限性及改进空间。

在Ruby中构建一个微型语言模型(LLM):逐步指南 - V3 "将推理整合到微型LLM中"

DEV Community
DEV Community · 2025-02-08T17:22:33Z
OpenAI 突然公开 o3-mini 思维链!首秀遭质疑,实测对比 DeepSeek R1,差距太明显

OpenAI 发布了 o3-mini 系列模型的思维链,帮助用户更清晰地理解模型的推理过程。尽管推理步骤未完全公开,模型仍能持续准确回答问题。与 DeepSeek R1 相比,o3-mini 的思维过程更简洁,展现出不同的思维风格。OpenAI CEO 解释了整理思维链的原因,强调了用户需求。

OpenAI 突然公开 o3-mini 思维链!首秀遭质疑,实测对比 DeepSeek R1,差距太明显

爱范儿
爱范儿 · 2025-02-07T06:10:28Z

OpenAI公开了o3-mini的思维链,用户可以查看其推理过程。尽管有网友感谢DeepSeek,但许多人质疑公开的思维链并非原始版本。OpenAI确认已对其进行处理,以确保安全和简化复杂性。o3-mini在回答问题时展现幽默感,但其思维过程仍有不足,引发讨论。

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

量子位
量子位 · 2025-02-07T04:07:16Z

本研究提出了一种新方法ReasVQA,旨在提升视频问答模型的性能。通过多模态大型语言模型生成推理过程,实验结果表明该方法在多个基准测试中显著提高了性能,验证了推理过程的重要性。

ReasVQA:通过不完善推理过程推进视频问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z
迈向System 2推理,100页论文硬核讲述Meta-CoT

Meta-CoT框架通过显式建模推理过程,扩展了传统思维链方法,以解决复杂问题。研究表明,传统方法未能有效捕捉真实数据生成过程,而Meta-CoT通过系统搜索和过程监督提升了推理能力,为大型语言模型提供了更强的推理能力和实践指导。

迈向System 2推理,100页论文硬核讲述Meta-CoT

机器之心
机器之心 · 2025-01-11T07:41:46Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码