小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在高频系统中平衡关系型纯粹性与速度

本文讨论了在高数据量系统中,关系型数据库的标准规范化可能导致性能下降。随着数据量增加,连接操作的开销增大,查询延迟加长。通过数据扁平化和列式压缩可以提高查询速度。建议识别高延迟查询,优化表结构,减少连接操作,以提升数据库性能。使用列式存储可显著减少存储占用并提高查询效率。

在高频系统中平衡关系型纯粹性与速度

Timescale Blog
Timescale Blog · 2026-04-24T12:41:52Z
明英:我们如何优化Postgres中的Top K查询

Postgres在处理Top K查询时面临挑战,尤其是带有过滤条件的查询。虽然B树索引可以加速查询,但在复杂条件下效率下降。相比之下,ParadeDB通过复合索引和列式存储优化了Top K查询性能,能够更快处理文本搜索和评分,减少查询时间。

明英:我们如何优化Postgres中的Top K查询

Planet PostgreSQL
Planet PostgreSQL · 2026-02-13T00:00:00Z

在FrOSCon 2025大会上,VictoriaMetrics的Aliaksandr Valialkin探讨了如何通过专用日志数据库处理PB级日志,显著提升查询性能。他介绍了列式存储、时间分区、日志流索引和布隆过滤器等技术,使查询时间从70小时缩短至10秒,指出传统数据库在大规模日志处理中的局限性。

日志查询从 70 小时到 10 秒?VictoriaMetrics 联创揭示 PB 级日志处理性能奥秘

Tony Bai
Tony Bai · 2025-08-20T00:34:17Z
Parquet?什么是Parquet?

Parquet是一种高效的列式存储格式,适合分析查询。文章分析了其内部结构及优化方法,如行组大小、压缩和编码对性能的影响。优化后,查询速度显著提升,行组大小调整带来了28倍的性能提升。了解Parquet特性有助于提高数据处理效率。

Parquet?什么是Parquet?

DEV Community
DEV Community · 2025-05-26T07:02:38Z
使用Parquet文件处理大规模数据:优缺点

Parquet是一种开源列式存储格式,适用于Apache Spark和Hadoop等大数据处理框架。它通过列存储提供高压缩率和查询性能,支持模式演变,兼容多种大数据工具。尽管写入速度较慢,不适合实时流处理或小数据集,但非常适合大规模分析工作负载。

使用Parquet文件处理大规模数据:优缺点

DEV Community
DEV Community · 2025-04-23T01:48:18Z
深入探讨列式数据库:它们的闪光点是什么

列式存储在数据工程和分析中显著提升了性能。与行存储数据库相比,列式存储通过按列组织数据,优化了查询效率。关键技术如数据压缩、列修剪和谓词下推,能有效降低I/O开销并加快执行速度,广泛应用于网络分析、商业智能和实时分析等领域。

深入探讨列式数据库:它们的闪光点是什么

The New Stack
The New Stack · 2025-02-07T18:00:10Z

ClickHouse是2016年由俄罗斯Yandex开源的列式存储数据库,具备高性能和强大的数据分析能力,适合大规模数据处理。其特点包括快速查询、数据压缩、分布式架构和丰富的分析功能,适用于实时数据分析和监控,但不支持事务处理和强一致性。

《ClickHouse:强大的数据分析引擎》

京东科技开发者
京东科技开发者 · 2024-12-10T02:16:56Z

本文介绍了如何使用PyArrow进行数据分析。PyArrow是一个高效的内存数据处理库,支持列式存储。文章详细讲解了PyArrow的核心数据结构,如Table、RecordBatch、Array等,并展示了如何读取和写入Parquet、JSON、CSV和Feather文件。还介绍了基本的数据操作,如过滤、连接和聚合。最后,文章介绍了通过PyArrow连接到Dremio进行高效数据传输的Apache Arrow Flight,适用于大数据分析。

使用 PyArrow 在 Python 中进行数据分析入门

DEV Community
DEV Community · 2024-10-15T15:27:53Z
Shaun Thomas:在Postgres中使用pg_timeseries比较列式存储与Heap存储性能

Tembo在芝加哥Postgres用户组展示pg_timeseries扩展,比较Hydra列式存储与Heap存储性能。测试显示,列式存储在插入和删除操作上表现更佳,尤其在数据量大时优势明显。更新操作上,列式存储也略胜一筹。结果表明,pg_timeseries在管理列式数据时性能优越,甚至可能比纯Postgres Heap分区更快。Tembo计划扩展测试以涵盖更多使用场景。

Shaun Thomas:在Postgres中使用pg_timeseries比较列式存储与Heap存储性能

Planet PostgreSQL
Planet PostgreSQL · 2024-10-10T09:00:00Z
列式存储:开发者实现实时分析的关键

开发者正在创建能根据用户偏好和环境变化实时调整的应用程序。通过整合操作和实时分析到一个数据库平台,利用列式存储提高效率,降低成本,简化架构。这让开发者能快速响应用户需求,提供无缝体验。企业若不适应,将落后于竞争。

列式存储:开发者实现实时分析的关键

The New Stack
The New Stack · 2024-09-27T14:00:15Z

本文介绍了OLTP和OLAP两种不同的数据存储方式,以及日志记录和索引的优化策略。OLTP适用于高请求量的用户界面,需要使用索引等策略来提高查询性能;OLAP适用于计算密集型的分析任务,通常采用列式存储。文章还提到了日志记录的重要性,以及通过压缩和合并等策略来优化存储空间。此外,还介绍了索引的作用和不同的索引策略,以及列式存储的优势。

设计数据密集型应用:存储与检索

DEV Community
DEV Community · 2024-09-11T06:21:30Z

Apache Parquet是一种流行的列式存储格式,使用pyarrow包可以轻松读写Parquet文件。可以转换DataFrame为Parquet文件,并选择只读取部分列。还可以从Parquet文件获取元数据和架构信息。pyarrow使得处理Parquet文件变得简单。

Python中读写Parquet文件的方法

极道
极道 · 2024-05-13T02:17:00Z

TiDB是PingCap开发的开源混合事务和分析处理(HTAP)数据库,使用Go编写的TiDB服务器是查询/事务处理组件,无状态且不存储数据。底层键值存储TiKV使用Rust编写,使用RocksDB作为存储引擎。TiDB还添加了一个名为TiFlash的列式存储。TiDB兼容MySQL,具有水平扩展、强一致性和高可用性。它提供了快照隔离和读提交的事务语义。通过Raft学习器添加了列式存储,以提供OLAP功能。

TiDB:基于Raf的类似CRDB分布式数据库

极道
极道 · 2023-12-06T07:02:00Z

ClickHouse是一个高性能的列式存储数据库,适用于大数据量的存储和分析。它具有写入性能好、查询性能高、支持实时数据分析等特点。ClickHouse的应用场景包括数据仓库、实时数据分析、时序数据存储和数据可视化等。优点包括查询快、写入性能好、支持高并发和高吞吐量等。缺点包括缺乏完整的事务支持、不擅长join操作和不支持高并发。总的来说,ClickHouse是一个适用于大数据存储和分析的高性能数据库。

基于ClickHouse解决活动海量数据问题

京东科技开发者
京东科技开发者 · 2023-07-19T10:00:47Z

Apache Arrow是一个用于内存分析的开发平台,支持高效的大数据处理和移动。Arrow定义了高压缩比的列式存储格式,并提供多种编程语言的实现。Arrow还包括通信传输和磁盘存储的子项目,方便数据传输和存储。Arrow格式规范向后兼容。

Go语言开发者的Apache Arrow使用指南:数据类型

Tony Bai
Tony Bai · 2023-06-24T20:43:38Z
为什么 OLAP 需要列式存储

列式存储更适合在线分析处理(OLAP),因其能快速读取特定列,减少I/O和内存资源浪费。与行式存储相比,列式存储将相同类型数据存储在一起,使用压缩算法提高压缩率,节省磁盘空间。尽管有优点,但也存在缺点,需根据具体场景选择合适的数据存储方式。

为什么 OLAP 需要列式存储

面向信仰编程
面向信仰编程 · 2021-02-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码