小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
这10个开源项目把智能体成本暴降十倍:压缩提示词、管理记忆、动态路由模型

本文介绍了10个开源项目,旨在降低AI智能体的成本。通过压缩提示词、管理记忆和动态路由模型等方法,减少无用信息输入,提高效率。项目如LLMLingua和mem0能有效提炼关键信息,LiteLLM则根据任务自动选择模型,整体目标是优化上下文处理,降低API调用成本,实现智能体的高效运作。

这10个开源项目把智能体成本暴降十倍:压缩提示词、管理记忆、动态路由模型

极道
极道 · 2026-05-07T12:07:00Z
PPIO首批上线DeepSeek-V4预览版,1M超长上下文能力开箱即用

DeepSeek-V4正式推出并开源,包含V4-Pro和V4-Flash两个版本,具备强大的AI能力。PPIO成为首批上线平台,支持百万字上下文处理和高效推理。该版本在模型结构和上下文效率上实现了突破,显著降低了计算需求,推动中国AI开源生态发展。

PPIO首批上线DeepSeek-V4预览版,1M超长上下文能力开箱即用

量子位
量子位 · 2026-04-24T09:10:46Z
AI的加速度

AI的发展正在快速加速,尤其在长任务处理和上下文理解方面。尽管大语言模型的基本原理未变,但其能力提升和CLI应用降低了编程门槛,推动了技术进步。同时,人们对AI的焦虑和FOMO情绪加剧,未来充满不确定性。

AI的加速度

托尼哥的玩具博客
托尼哥的玩具博客 · 2026-03-15T14:30:46Z
刚刚,ChatGPT 和 Claude 同时大更新,不会给 AI 当老板的打工人要被淘汰

OpenAI 和 Anthropic 发布了重要更新,分别为 GPT-5.3-Codex 和 Claude Opus 4.6。GPT-5.3-Codex 在自我编程能力和准确率上有显著提升,而 Claude Opus 4.6 在上下文处理和复杂任务管理方面取得突破。未来,AI 将成为管理者的助手,改变工作方式。

刚刚,ChatGPT 和 Claude 同时大更新,不会给 AI 当老板的打工人要被淘汰

爱范儿
爱范儿 · 2026-02-05T22:26:22Z
MiroThinker - 一个支持工具增强推理的开源搜索代理,适用于超长文档的检索

MiroThinker是一个开源的研究级搜索代理,支持工具增强推理和深度信息检索,具备256K的上下文处理能力,适用于学术研究和长文档问答,主要用Python实现,提供多种工具集成和部署选项。

MiroThinker - 一个支持工具增强推理的开源搜索代理,适用于超长文档的检索

云原生
云原生 · 2026-01-11T12:48:43Z
介绍用于基于文件系统的上下文检索的bash-tool

我们开源了bash-tool,这是一个用于文本转SQL的Bash执行引擎。它通过执行类似bash的命令来优化上下文处理,减少token使用,提高响应的准确性和性能。bash-tool支持在内存和沙箱环境中运行,允许按需检索小块上下文。

介绍用于基于文件系统的上下文检索的bash-tool

Vercel News
Vercel News · 2026-01-07T13:00:00Z
Qwen3-VL技术报告英中对照版.pdf

Qwen3-VL是阿里推出的多模态基础模型,支持文本、图像和视频等多种数据类型,具备256K上下文处理能力。其核心技术包括频率交错、视觉特征注入和文本时间戳,训练体系完善,表现优异,适用于企业智能应用。

Qwen3-VL技术报告英中对照版.pdf

我爱自然语言处理
我爱自然语言处理 · 2025-11-29T10:34:27Z

本研究提出WavRAG框架,解决了现有检索增强生成模型在处理语音输入时的信息丢失和转换错误问题。WavRAG能够直接处理原始音频,将音频与文本整合为统一知识表示,显著提升口语对话模型的上下文处理能力,并实现10倍加速,拓展了音频领域的应用。

WavRAG: Audio-Integrated Retrieval-Augmented Generation for Spoken Dialogue Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

研究表明,预训练语言模型在自然语言推理中表现良好,但在本体论推断方面需要更多背景知识。通过结合外部知识源和新方法,可以提升模型的上下文处理能力,减少幻觉现象。研究提出了评估本体完成方法的基准,发现混合策略效果最佳,并针对大型语言模型的幻觉现象开发了新的数据集和框架,以推动本体匹配领域的发展。

结构化数据能减少认知不确定性吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z
从 Jina Embeddings v2 迁移到 v3

Jina Embeddings v3是多语言嵌入模型的重大升级,支持89种语言,具备任务LoRA、长上下文支持和Matryoshka学习。默认输出1024维,可自定义维度。v3与v2不兼容,需重新索引文档。v3在多语言检索和分类任务中表现优异,新增“晚期分块”功能提升上下文处理能力。适用于多任务场景。

从 Jina Embeddings v2 迁移到 v3

Jina AI
Jina AI · 2024-09-27T15:32:59Z

Video-LLaMA是一种多模态框架,结合视觉和音频编码器与大型语言模型,提升视频内容理解能力。研究评估了Video-LLM在视频理解中的表现,揭示其与人类的差距,并展示其在空间时间推理和通识知识方面的优势。通过改进模型结构和训练策略,LongVILA显著提高了长视频的上下文处理能力,展现了在视频理解领域的巨大潜力。

袋鼠:支持长视频输入的强大视频语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-28T00:00:00Z
ReALM:将参考解析视为语言建模

本文讨论了参考解析的重要性,特别是在处理非对话实体时。研究表明,利用大型语言模型(LLMs)能够有效解决各种引用问题,尤其是在屏幕引用方面,相较于现有系统有显著改进。MARRS系统旨在处理对话、视觉和背景等多种上下文。

ReALM:将参考解析视为语言建模

Apple Machine Learning Research
Apple Machine Learning Research · 2024-08-16T00:00:00Z

本文介绍了基于状态空间模型(SSM)的Mamba架构,旨在解决Transformer在内容导向推理中的不足。Mamba模型在推断速度和序列长度扩展方面表现优异,适用于语言、音频和基因组等多模态任务。此外,研究还提出了DeciMamba和Graph-Mamba,进一步提升了模型的上下文处理能力和预测性能。实验结果显示,Mamba在多项任务上超越了Transformer,展现出强大的多模态学习潜力。

PackMamba: Mamba 训练中可变长度序列的高效处理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码