小红花·文摘

AI in Harness（一）

犀利豆的博客 ·

我们如何构建一个内部数据分析代理

The GitHub Blog ·

[MAF的Agent管道详解-05]对话历史的持久化和输入输出的增强 - Artech

Artech ·

这10个开源项目把智能体成本暴降十倍：压缩提示词、管理记忆、动态路由模型

极道 ·

PPIO首批上线DeepSeek-V4预览版，1M超长上下文能力开箱即用

量子位 ·

AI的加速度

托尼哥的玩具博客 ·

刚刚，ChatGPT 和 Claude 同时大更新，不会给 AI 当老板的打工人要被淘汰

爱范儿 ·

MiroThinker - 一个支持工具增强推理的开源搜索代理，适用于超长文档的检索

云原生 ·

介绍用于基于文件系统的上下文检索的bash-tool

Vercel News ·

Qwen3-VL技术报告英中对照版.pdf

我爱自然语言处理 ·

本研究提出WavRAG框架，解决了现有检索增强生成模型在处理语音输入时的信息丢失和转换错误问题。WavRAG能够直接处理原始音频，将音频与文本整合为统一知识表示，显著提升口语对话模型的上下文处理能力，并实现10倍加速，拓展了音频领域的应用。

WavRAG: Audio-Integrated Retrieval-Augmented Generation for Spoken Dialogue Models

BriefGPT - AI 论文速递 ·

研究表明，预训练语言模型在自然语言推理中表现良好，但在本体论推断方面需要更多背景知识。通过结合外部知识源和新方法，可以提升模型的上下文处理能力，减少幻觉现象。研究提出了评估本体完成方法的基准，发现混合策略效果最佳，并针对大型语言模型的幻觉现象开发了新的数据集和框架，以推动本体匹配领域的发展。

结构化数据能减少认知不确定性吗？

BriefGPT - AI 论文速递 ·

从 Jina Embeddings v2 迁移到 v3

Jina AI ·

Video-LLaMA是一种多模态框架，结合视觉和音频编码器与大型语言模型，提升视频内容理解能力。研究评估了Video-LLM在视频理解中的表现，揭示其与人类的差距，并展示其在空间时间推理和通识知识方面的优势。通过改进模型结构和训练策略，LongVILA显著提高了长视频的上下文处理能力，展现了在视频理解领域的巨大潜力。

袋鼠：支持长视频输入的强大视频语言模型

BriefGPT - AI 论文速递 ·

ReALM：将参考解析视为语言建模

Apple Machine Learning Research ·

本文介绍了基于状态空间模型（SSM）的Mamba架构，旨在解决Transformer在内容导向推理中的不足。Mamba模型在推断速度和序列长度扩展方面表现优异，适用于语言、音频和基因组等多模态任务。此外，研究还提出了DeciMamba和Graph-Mamba，进一步提升了模型的上下文处理能力和预测性能。实验结果显示，Mamba在多项任务上超越了Transformer，展现出强大的多模态学习潜力。

PackMamba: Mamba 训练中可变长度序列的高效处理

BriefGPT - AI 论文速递 ·

本研究提出了多种机器翻译方法，包括基于字节的翻译、文档级上下文处理和多尺度协作框架，旨在提高翻译质量和模型性能。实验结果表明，这些方法在多语言翻译和特定任务中表现优越，尤其在上下文理解和词汇共享方面取得了显著进展。

基于字节的神经机器翻译中整合多尺度上下文信息

BriefGPT - AI 论文速递 ·

本文介绍了多种增强语言模型记忆和上下文处理能力的方法，如LongMem框架、CaMeLS算法、关联记忆模块、L2MAC计算机和MEMORYLLM模型。这些方法显著提升了文本生成、语音识别和机器翻译的性能，增强了模型的可控性和鲁棒性。

在线自适应语言模型与分摊背景的记忆

BriefGPT - AI 论文速递 ·