小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大规模语言模型工作负载的令牌高效数据准备指南

随着RAG架构和AI系统的扩展,数据序列化效率低下导致40%至70%的令牌浪费,增加API成本并降低模型性能。优化策略包括消除结构冗余、优化数值精度和应用层次扁平化。有效的数据准备和预处理能显著提升令牌效率,降低成本,增强AI部署的经济性。

大规模语言模型工作负载的令牌高效数据准备指南

The New Stack
The New Stack · 2025-12-06T19:00:34Z
在深度代理中使用技能

Anthropic推出了代理技能的概念,技能是包含SKILL.md文件的文件夹,代理可以动态加载以提升任务执行能力。通用代理如Claude Code和Manus使用的工具数量较少,但通过访问计算机和文件系统,代理能够执行多种操作。技能提高了令牌效率,减少了认知负担,并支持持续学习与共享。深度代理CLI现已支持技能,用户可以轻松创建和使用技能。

在深度代理中使用技能

LangChain Blog
LangChain Blog · 2025-11-25T16:45:09Z
在深度代理中使用技能

Anthropic推出了“代理技能”概念,允许代理动态加载任务文件夹以提高执行效率。通用代理如Claude Code和Manus使用的工具数量较少,但能通过访问计算机和文件系统执行多种操作。技能的优势在于提高令牌效率和减少认知负担,支持代理在新任务出现时即时创建新技能。

在深度代理中使用技能

LangChain Blog
LangChain Blog · 2025-11-25T16:45:09Z

本研究提出DLCoT框架,解决长链思维蒸馏方法的有效性不足,通过数据分段和优化中间错误状态,显著提升模型性能和令牌效率。

Deconstructing Long-Chain Thinking: A Structured Reasoning Optimization Framework for Long-Chain Thinking Distillation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了动态令牌合并框架DYTO,旨在提升零-shot视频任务的保真度和令牌效率。实验结果表明,DYTO优于传统方法,设立了新标准。

超越训练:用于零-shot视频理解的动态令牌合并

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码