Ying’s Blog ·

记忆和向量-读《图解大模型》

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

记忆大模型无状态，短期记忆通过对话缓冲区和摘要实现。RAG利用知识库解决知识过时问题，文档向量化和长文本分块策略至关重要。有效分块需提取重点，结合单文档和多向量策略，以优化搜索效果。

🎯

❓

记忆大模型通过对话缓冲区和对话摘要实现短期记忆。

RAG通过知识库解决了大模型知识过时和缺乏专业知识的问题。

文档向量化是将分块转化为向量表示，并存储在向量数据库中以备检索。

长文本分块策略面临LLM的tokens上限挑战。

通过结合单文档提取和多向量分块策略，可以优化搜索效果。

对话摘要用于将历史对话转为摘要，以解决对话缓冲区内容过多的问题。

🏷️

Studio CLI：终端驱动的本地开发利器，全流程 WordPress 自动化管理
Studio CLI 是一款基于终端的 WordPress 本地开发工具，支持全流程自动化管理。用户可通过命令行创建、管理和预览站点，深度集成 WP-CL...
给 WordPress 7.0 的 AI 连接功能加上 DeepSeek 支持
WordPress 7.0 更新了 AI 连接功能，但仅支持国外提供商。为此，开发者推出了 WPJAM AI 插件，支持国内的 DeepSeek 等模型。...
Kakapo：使用 Wails v3、Go 和 Echo 构建一个本地翻译工作台
Kakapo 是一款基于 Wails v3 和 Go 的桌面翻译工具，整合多个 OpenAI 兼容模型，提供翻译、比较和历史记录功能。它解决了传统翻译工具...
Inside Google’s System for Coordinated A/B Testing across its Global Service Fleet
Google has shared details of its fleet wide large scale A/B experimentation s...
Apple新闻之苹果公布 2026 年 Apple 设计大奖得主
苹果公司公布了2026年Apple设计大奖得主，表彰从36款入围作品中选出的12款杰出App。奖项分为六个类别，每个类别各有一款游戏和一款非游戏类App获奖。
OpenAI是如何构建其数据代理的
OpenAI的数据平台存储了1.5 exabytes的数据，支持约4000名内部用户。为提高数据分析效率，OpenAI开发了一个数据代理，能够快速回答用户...