小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

搜索引擎的倒排索引需要高效的整数压缩以节省存储和提高查询速度。文章介绍了多种压缩算法,如varint、PForDelta、SIMD-BP128和Roaring Bitmap,分析了它们的优缺点及应用场景。选择合适的算法需考虑数据特性和性能需求。

整数压缩:varint → PForDelta → SIMD-BP128

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-12T00:00:00Z
设计解耦:亿级向量搜索

Databricks重新设计了向量搜索系统,以应对从百万到十亿向量的数据集扩展问题。新系统提供标准和存储优化两种部署选项,后者通过分离存储与计算,降低成本和延迟。采用反向文件索引和产品量化等技术,使索引构建速度提高20倍,服务成本降低7倍,适用于语义搜索和推荐系统等应用。

设计解耦:亿级向量搜索

Databricks
Databricks · 2026-03-09T19:00:00Z
垂直扩展:买不起的时间

Postgres在高频数据写入时存在性能瓶颈,纵向扩展无法根本解决问题。随着数据量增加,成本和延迟上升,工程师需耗费大量时间处理数据库操作。对于持续高频写入的工作负载,建议使用TimescaleDB,以优化存储引擎和写入路径,减少开销。

垂直扩展:买不起的时间

Timescale Blog
Timescale Blog · 2026-02-26T14:48:27Z
基于Amazon Glue优化Iceberg表的合并功能在亚马逊云科技中国区域的实现

亚马逊云科技推出Amazon Glue的合并功能,优化Iceberg表的存储和查询性能,通过合并小文件降低I/O开销,提高查询速度。提供了一种利用CloudFormation模板实现一键式部署的解决方案,满足中国区域客户需求。

基于Amazon Glue优化Iceberg表的合并功能在亚马逊云科技中国区域的实现

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-11-21T03:50:36Z
搜索节点的艺术与科学

为优化搜索部署,确保系统与工作负载匹配至关重要。新推出的存储优化搜索节点专为大型索引设计,降低存储成本,避免过度配置计算资源,适用于索引增长但查询和索引速率稳定的场景,提供更高的存储容量和成本效益。

搜索节点的艺术与科学

MongoDB
MongoDB · 2025-08-12T14:00:00Z
Vercel Blob 见解现已在可观察性中提供

仪表板新增Vercel Blob标签,提供Blob存储使用情况的数据,包括数据传输、下载量、缓存活动和API操作,帮助团队分析用户代理、边缘区域和客户端IP,以识别使用模式和优化存储。

Vercel Blob 见解现已在可观察性中提供

Vercel News
Vercel News · 2025-05-19T13:00:00Z
Git技巧 2/3

本文介绍了实用的Git命令,如git stash、git cherry-pick、git bisect、git tag、git diff、git blame和git commit --amend。这些命令帮助用户管理代码更改、查找错误、标记版本和优化存储空间,作者分享了个人经验和使用场景,期待读者反馈。

Git技巧 2/3

DEV Community
DEV Community · 2025-03-29T10:19:09Z
优化SharePoint版本控制:管理员实用指南

本文介绍了如何在SharePoint Online中管理文档版本控制,包括通过SharePoint UI和PowerShell修改版本设置。管理员可设定全局政策,以优化存储和确保文档历史的有效性。在配置时需考虑组织需求、自动化使用、存储配额和定期监控,以实现高效的版本管理。

优化SharePoint版本控制:管理员实用指南

DEV Community
DEV Community · 2025-03-11T07:30:00Z

搭建WordPress网站所需的硬盘空间因网站类型而异。一般来说,核心文件、插件和媒体文件占用较大空间。大多数WordPress网站平均使用约1GB存储。用户常常高估需求,实际使用通常低于购买配额。建议定期检查存储情况,优化图片和清理不必要的文件,以节省空间并提高网站性能。

搭建WordPress网站的主机需要多大硬盘空间?

王会博客
王会博客 · 2025-02-19T15:25:35Z
沐瞳科技大数据成本优化最佳实践

沐瞳科技通过亚马逊云科技优化大数据系统,解决了计算资源闲置和存储成本上升的问题。项目包括存储优化、成本优化和生命周期管理三个阶段,实施后显著降低了存储费用,提高了资源利用率,实现了自动化管理。

沐瞳科技大数据成本优化最佳实践

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-02-19T06:46:24Z

PaddleNLP推出Unified Checkpoint技术,通过灵活的分布式策略切换和优化Checkpoint存储,显著提升训练效率和存储速度,节省空间,改善训练体验。

飞桨大模型Unified Checkpoint技术加速模型存储95%,节省空间78.5%

百度大脑
百度大脑 · 2024-12-13T13:35:27Z
EC2实例类型及其使用案例

通用实例适用于网页应用,平衡计算、内存和网络需求;计算优化实例满足高性能需求;内存优化实例适合数据密集型应用;加速计算实例用于游戏流和图形应用;存储优化实例适合快速数据访问的应用。

EC2实例类型及其使用案例

DEV Community
DEV Community · 2024-12-02T18:21:13Z
提升Pinterest Goku时间序列数据库的效率

Pinterest更新了Goku时间序列数据库,优化了存储和资源使用,数据存储需求降低了37%。新特性包括指标命名空间和高写入指标识别,显著降低基础设施成本。通过内存优化和压缩算法,Pinterest实现了40%的存储减少和70%的成本降低,同时支持30%的存储增长。

提升Pinterest Goku时间序列数据库的效率

InfoQ
InfoQ · 2024-11-06T20:00:00Z
File Cleaner Pro - 一款用于文件管理的Python学习项目

File Cleaner Pro是一款AI驱动的文件管理工具,能够智能整理文件、消除重复、优化存储并保护重要数据,适合摄影师、专业人士和开发者,提高文件管理效率。

File Cleaner Pro - 一款用于文件管理的Python学习项目

DEV Community
DEV Community · 2024-10-30T10:45:34Z
介绍File Cleaner Pro:您的AI驱动数字空间整理工具

File Cleaner Pro是一款AI驱动的文件管理工具,能够智能整理数字空间,消除重复文件,优化存储并保护重要文件。它利用机器学习技术,帮助用户节省存储空间,提高文件访问速度,确保数据安全。

介绍File Cleaner Pro:您的AI驱动数字空间整理工具

DEV Community
DEV Community · 2024-10-28T16:45:53Z
如何使用AWS CLI和AWS SDK自动创建S3生命周期

Amazon S3生命周期功能帮助用户优化存储成本和自动化数据管理,包括对象存储类别转换和到期删除。支持标准、智能分层、低频访问等存储类别。S3策略无法阻止生命周期规则。文章介绍了如何使用AWS CLI和SDK创建S3生命周期规则,CLI方法需注意新规则会覆盖旧规则,SDK方法通过AWS SAM在Lambda上运行。

如何使用AWS CLI和AWS SDK自动创建S3生命周期

DEV Community
DEV Community · 2024-09-29T15:58:45Z
所有数据中心现已提供高级内存优化和高级存储优化Droplets以提升网络性能

DigitalOcean现在在所有数据中心提供高级内存优化和高级存储优化的Droplets。高级内存优化Droplets适用于内存密集型应用程序,而高级存储优化Droplets适用于大型数据集应用程序。这些新的Droplets提供更高的出站网络速度和简单的云体验。它们在多个数据中心可用。

所有数据中心现已提供高级内存优化和高级存储优化Droplets以提升网络性能

The DigitalOcean Blog
The DigitalOcean Blog · 2024-08-01T17:27:58Z

本文讨论了采购系统中海量数据的治理和存储优化,以lifecycle表为例,提出了迁移方案,保证了读写稳定和准确,最终完成了整体平滑迁移。

分享一次海量数据平滑迁移实战

京东科技开发者
京东科技开发者 · 2024-07-03T08:06:42Z

本文介绍了应用优化的方法,主要针对IO密集型项目进行存储和IO相关的优化工作。优化原则是面向收益编程,越靠近业务应用层效果越明显。确定优化目标可根据监控系统指标确定具体的优化接口和代码。优化方法包括零请求、数据组合、编码/解码、缓存key命名、时间区间和读写分离。作者提醒要全面了解Redis,不要将其仅当作纯K-V存储使用。

降本增效之应用优化 (一) Redis

蛮荆
蛮荆 · 2023-09-07T00:00:00Z
优化器

Qdrant的优化器通过批量处理更改提高效率,支持段级存储优化。Vacuum Optimizer用于清理已删除记录,Merge Optimizer合并小段以提升搜索性能。Indexing Optimizer根据记录数量选择索引类型,并动态更新参数以优化加载过程。优化监控功能提供当前优化状态和历史记录。

优化器

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码