小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大规模AI检索正成为系统问题,而非工具问题

文章讨论了AI检索架构的演变,强调从单一向量搜索向综合检索和排名架构的发展。随着AI应用需求增加,系统性能、排名质量和架构简化变得愈发重要。报告指出系统碎片化导致维护成本上升,建议逐步整合检索能力,以提高效率和用户体验。

大规模AI检索正成为系统问题,而非工具问题

The New Stack
The New Stack · 2026-05-31T16:00:00Z
克里斯托夫·佩图斯:将所有GUC参数一一列出:checkpoint_timeout和checkpoint_completion_target

本文讨论了PostgreSQL中的两个重要检查点参数:checkpoint_timeout和checkpoint_completion_target。检查点是确保脏页写入磁盘的时刻,影响崩溃恢复时间。建议将checkpoint_timeout设置为至少15分钟,以减少写放大和I/O负担,同时将checkpoint_completion_target设置为0.9,以平滑I/O负载。合理配置可提高系统性能和稳定性。

克里斯托夫·佩图斯:将所有GUC参数一一列出:checkpoint_timeout和checkpoint_completion_target

Planet PostgreSQL
Planet PostgreSQL · 2026-05-22T01:00:00Z
为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

在生产环境中,RAG系统的主要瓶颈是检索,而非模型本身。随着数据量增加,检索质量下降,导致模型生成不准确的答案。有效的检索架构应结合混合检索、早期过滤和多阶段排名,以确保高召回率和低延迟。检索质量直接影响系统性能,需整体优化。

为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

The New Stack
The New Stack · 2026-05-19T14:00:00Z
深度拆解:AI Agent Harness 的构造

本文探讨了AI Agent Harness的构造及其在大语言模型(LLM)应用中的重要性。Agent Harness是一个完整的架构,包含编排循环、工具、记忆和上下文管理等组件。优化这些基础设施可以显著提升系统性能。文章分析了生产级Harness的核心组件及其工程化层次,强调设计良好的Harness对Agent表现的影响。

深度拆解:AI Agent Harness 的构造

宝玉的分享
宝玉的分享 · 2026-05-10T00:00:00Z

本文探讨了Linux内核的工程接口及eBPF在生产环境中的应用,涵盖容器数据面Cilium的演变、低开销的追踪与观测,以及用户态分配器对系统性能的影响,共收录10篇相关内容。

Linux 内核与 eBPF 工程索引

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

在2019年双十一期间,阿里巴巴通过全链路压测验证系统性能,成功处理了54.4万笔订单请求。压测包括负载测试、压力测试和浸泡测试,确保系统在高流量下稳定运行。采用流量录制与回放、影子流量架构等技术,解决数据隔离和环境保真度问题,发现并修复了200多个性能问题,确保了大促当天的系统稳定性。

【系统架构设计】全链路压测:大规模系统的性能验证

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
京东缓存中间件架构与缓存内核优化

京东开发了统一缓存中间件DongKV,以应对高并发系统中的缓存管理问题。该中间件提供标准化的部署架构和容灾策略,确保数据一致性。通过主备和互备模式,DongKV实现高可用性和数据同步,优化了缓存与持久化存储的结合,提升了系统性能和可用性。

京东缓存中间件架构与缓存内核优化

京东科技开发者
京东科技开发者 · 2026-04-03T07:48:26Z

本文讨论了PD分离中transfer_kv控制面动作的优化,通过引入bypass和substep机制,提高了数据传输的及时性,确保源端在双请求和迁移场景中迅速开始KV搬迁。优化设计有效解决了时序问题,增强了系统性能和响应速度。

Rapid transfer_kv:只为更快的 PD 分离

学习让我快乐
学习让我快乐 · 2026-03-26T16:00:00Z
播客:[视频播客] 在金融系统中构建弹性事件驱动微服务,嘉宾:Muzeeb Mohammad

在本期节目中,Thomas Betts与Muzeeb Mohammad讨论了构建金融系统事件驱动微服务的核心原则与挑战。Muzeeb分享了在JP Morgan Chase的经验,强调使用Kafka等技术提升系统性能和可靠性,以及通过异步处理加速客户服务流程。

播客:[视频播客] 在金融系统中构建弹性事件驱动微服务,嘉宾:Muzeeb Mohammad

InfoQ
InfoQ · 2026-02-16T11:00:00Z
ShareChat每秒处理十亿个特征,随后需要将成本降低10倍

ShareChat团队成功将实时特征存储的处理能力从每秒100万特征提升至10亿特征,并通过优化数据库架构、清理资源和迁移至ScyllaDB等方法,实现了成本降低10倍,同时保持系统性能。

ShareChat每秒处理十亿个特征,随后需要将成本降低10倍

The New Stack
The New Stack · 2026-02-12T14:00:08Z

作者分享了在 Windows 11 上的操作经验,包括恢复 Windows 10 右键菜单、使用 Win11Debloat 移除预装应用、调整字体渲染、优化任务栏设置和禁止商店自动更新,此外还提到了一些工具和注册表修改以提升系统性能和使用体验。

我的 Windows 11 装机必做

闪星空间
闪星空间 · 2026-01-15T23:05:24Z
考试预生成方案

本文介绍了一种考试记录预生成方案,通过定时任务在低负载时段批量创建考试记录,显著提升系统性能和用户体验,减少数据库压力,确保数据一致性,适用于大规模考试和高并发场景。

考试预生成方案

dotNET跨平台
dotNET跨平台 · 2025-12-30T23:58:35Z
如何通过评估飞轮测试和改进AI应用

传统编程依赖单元测试来捕捉错误,但AI产品缺乏这种保障。AI模型输出不稳定,传统测试方法无法有效检测准确性下降或幻觉。文章介绍了评估飞轮作为AI应用测试的实用方法,通过持续改进和反馈循环来确保系统性能。

如何通过评估飞轮测试和改进AI应用

freeCodeCamp.org
freeCodeCamp.org · 2025-12-22T10:18:04Z
【Rust日报】2025-12-19 bincode 永久停止开发,虽改写了提交 hash,但仍与历史源码保持一致

Kraken团队将Rust从实验性语言转变为核心基础设施,现已拥有数百万行Rust代码,显著提升了系统的性能和稳定性。通过逐步替换PHP,团队实现了高效的技术架构和文化,促进了知识共享与AI辅助开发,增强了金融系统的可靠性。

【Rust日报】2025-12-19 bincode 永久停止开发,虽改写了提交 hash,但仍与历史源码保持一致

Rust.cc
Rust.cc · 2025-12-19T12:04:24Z

MySQL是流行的关系型数据库管理系统,广泛应用于WEB。Linux是一种开放源码的操作系统,运维工程师需掌握Linux和容器技术,以提高系统性能和管理效率。

1xSlots (1хСлотс) доступность платформы.2100

运维派
运维派 · 2025-11-18T22:03:29Z
部件适配

文章探讨了系统性能与部件适配的重要性,强调单独改进部件可能导致不兼容。招聘时应关注“文化增益”,而非仅仅追求“文化契合”。在设计复杂系统时,过于统一的技术栈可能增加成本和风险,需谨慎评估重构的必要性和收益。部件之间的相互作用比单一相似性更为重要。

部件适配

Alex Ewerlöf Notes
Alex Ewerlöf Notes · 2025-11-12T14:37:00Z
构建更优秀的语言模型应用的关键分块技术

在构建检索增强生成(RAG)应用时,文档分块至关重要,影响信息检索和生成的准确性。常见的分块策略有固定大小、递归、语义和文档基础等。选择合适的分块方法需考虑文档特性和检索需求,以提升系统性能。

构建更优秀的语言模型应用的关键分块技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-06T11:00:54Z
Datadog如何构建自定义数据库以每秒接收数十亿个指标

Datadog的工程团队开发了Monocle,一个高效的时间序列存储引擎,通过分离数据与元数据、使用Kafka进行数据分发,实现了快速响应和高并发处理,显著提升了系统性能。

Datadog如何构建自定义数据库以每秒接收数十亿个指标

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-11-04T15:31:09Z

金融级业务的性能优化面临挑战,尽管表面指标合格,但CPU成本成为瓶颈。通过OpenResty XRay分析发现,Gzip压缩配置不当导致CPU资源浪费。优化建议包括降低压缩级别和减少异常处理,以提升系统性能。

OpenResty XRay 如何精准定位 Gzip 配置的隐性成本

OpenResty 官方博客
OpenResty 官方博客 · 2025-10-27T00:00:00Z

运维派通过系统化的Kubernetes成本优化,将云费用从35万元降至14万元,节省60%。优化措施包括合理配置资源、弹性伸缩、使用抢占式实例、存储优化和网络负载均衡,系统性能提升30%。

Kubernetes集群成本优化:我是如何用3个月省下公司60%云账单的

运维派
运维派 · 2025-10-11T07:32:10Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码