小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
李超:通过repack.c理解PostgreSQL REPACK

PostgreSQL 19的新特性REPACK通过重写表来物理压缩数据,类似于VACUUM,但创建新文件而非清理现有页面。REPACK CONCURRENTLY允许在操作期间保持表可用,使用快照复制并重放并发更改,确保逻辑身份不变,同时有效回收磁盘空间。

李超:通过repack.c理解PostgreSQL REPACK

Planet PostgreSQL
Planet PostgreSQL · 2026-04-20T08:55:26Z
提升Magic Pocket中不可变Blob存储的存储效率

Magic Pocket是Dropbox的核心存储系统,通过改进数据压缩策略,提高存储效率,解决了存储碎片化问题,降低了存储成本。新策略L2和L3有效回收未充分利用的存储空间,提升整体性能。

提升Magic Pocket中不可变Blob存储的存储效率

Dropbox Tech Blog
Dropbox Tech Blog · 2026-04-02T17:00:00Z
Meta开源OpenZL:一个针对结构化数据的通用压缩框架

Meta最近开源了OpenZL,这是一个针对高度结构化数据的新数据压缩框架。与通用工具相比,OpenZL通过显式建模数据结构,实现更好的压缩比和速度。其通用解压器简化了操作,无需外部元数据,支持单一二进制文件的全局更新,特别适用于时间序列数据、机器学习张量和数据库表。开发者可在GitHub上进行实验和贡献。

Meta开源OpenZL:一个针对结构化数据的通用压缩框架

InfoQ
InfoQ · 2025-10-28T10:00:00Z
介绍OpenZL:一个开源的格式感知压缩框架

OpenZL是一个新开源的无损数据压缩框架,专为结构化数据设计,结合了特定格式压缩器的性能与易维护性。用户可通过提供数据结构实现高效压缩,所有文件可用同一解压缩器解压。OpenZL在压缩比和速度上优于通用工具,适合时间序列和机器学习张量等数据。

介绍OpenZL:一个开源的格式感知压缩框架

Engineering at Meta
Engineering at Meta · 2025-10-06T16:00:53Z
常见Python标准库函数的非常规用法

本文探讨了Python标准库中的groupby()、zip()和bisect等函数在数据压缩、矩阵转置、维护排序和查找极值等方面的应用,展示了它们的灵活性和高效性。

常见Python标准库函数的非常规用法

KDnuggets
KDnuggets · 2025-09-12T15:23:42Z
推出Direct Compress:为开发者提供高达40倍更快、更轻量的数据摄取(技术预览)

TimescaleDB推出Direct Compress功能,能在数据摄取时直接在内存中压缩数据,提升插入性能达40倍,减少I/O开销,简化数据库维护。目前在2.21版本中提供技术预览,支持COPY操作,未来将支持INSERT。

推出Direct Compress:为开发者提供高达40倍更快、更轻量的数据摄取(技术预览)

Timescale Blog
Timescale Blog · 2025-09-09T13:00:52Z
专利态势分析显示 Fraunhofer 和 Dolby 领先音频编解码器竞争

数字音频技术在现代通信和娱乐中至关重要,音频编解码器如AAC、Opus、MPEG-H和EVS优化音质与数据压缩。专利池简化了标准必要专利的获取,透明的专利信息对行业发展至关重要。Fraunhofer和杜比等公司在专利布局中处于领先地位。

专利态势分析显示 Fraunhofer 和 Dolby 领先音频编解码器竞争

实时互动网
实时互动网 · 2025-06-16T03:44:48Z
红帽Linux中的数据压缩与备份:大数据量的救星

数据压缩和备份对大数据处理至关重要。压缩节省存储空间、加快传输速度,常用工具有gzip、bzip2和tar。备份防止数据丢失,支持灾难恢复,常用工具有rsync和Timeshift。掌握这些技能有助于有效管理数据。

红帽Linux中的数据压缩与备份:大数据量的救星

DEV Community
DEV Community · 2025-05-24T19:26:46Z

本研究提出Robo-DM工具包,旨在解决大型机器人数据集管理问题,优化数据策划、分发和加载。该开源云工具显著减小数据集大小,降低传输成本,提高加载速度,压缩性能可节省空间高达70倍,且不影响任务准确性。

Robo-DM: Data Management for Large Robot Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
什么是数据压缩?

数据压缩是用更少的比特编码信息的过程,分为无损和有损两种。无损压缩保留所有数据,有损压缩则去除不重要的信息。压缩方案设计需平衡压缩率、失真和计算资源。

什么是数据压缩?

DEV Community
DEV Community · 2025-05-13T10:19:20Z

本研究针对物联网环境中的视觉异常检测,提出了高效处理策略和数据压缩技术,显著提升了检测效果,为工业应用提供了新方案。

Scalable Visual Anomaly Detection IoT Deployment through Efficient Compression

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z
每日JavaScript挑战 #JS-172:使用游程编码算法对字符串进行编码

本文介绍了一个JavaScript编程挑战:实现游程编码(Run-Length Encoding)函数,通过用字符及其出现次数替代连续相同字符来实现数据压缩。挑战难度为中等,鼓励开发者分享解决方案和经验。

每日JavaScript挑战 #JS-172:使用游程编码算法对字符串进行编码

DEV Community
DEV Community · 2025-05-08T00:00:53Z

本研究解决了小卫星技术中数据传输效率低和实时异常检测不足的问题。采用卷积自编码器实现数据压缩和源头异常检测,提升了小卫星在灾害监测中的应用性能。研究结果显示,机器学习方法可有效提升小卫星数据处理效率,并推动非洲空间技术与人工智能的发展。

用于小卫星技术的数据压缩和异常检测的卷积自编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z
Arbitrum与区块链上去中心化身份和数据压缩的未来

本文探讨了Arbitrum的Layer 2扩展技术与去中心化身份和数据压缩的结合潜力,分析了其在NFT市场、去中心化存储和供应链管理中的应用,讨论了当前挑战与未来创新,强调这些技术的融合为安全、可扩展且经济高效的区块链生态系统奠定基础。

Arbitrum与区块链上去中心化身份和数据压缩的未来

DEV Community
DEV Community · 2025-04-25T13:22:47Z

本研究探讨了在分布式环境中监测和分类GNSS干扰的挑战,提出使用变分自编码器(VAE)进行特征解耦,以实现数据压缩和增强。结果表明,该方法的分类准确率可达到99.92%。

VAE-based Feature Disentanglement for Data Augmentation and Compression in Generalized GNSS Interference Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z
高效计算 · 第1期

本期介绍了优化工具和技术,重点关注AI训练的碳排放问题,探讨新型芯片、AWS服务、数据压缩和无GPU模型,以提高效率、降低成本和能耗。

高效计算 · 第1期

DEV Community
DEV Community · 2025-04-03T07:00:00Z
潜在空间在生成性人工智能中扮演什么角色?

潜在空间在生成性人工智能中至关重要,它以压缩方式表示数据,捕捉关键特征和模式。通过调整潜在变量,用户可以修改图像特定属性,从而提高效率,减少数据维度,加快训练和推理速度。理解潜在空间对从事生成性人工智能的人至关重要。

潜在空间在生成性人工智能中扮演什么角色?

DEV Community
DEV Community · 2025-03-29T09:32:23Z

本文研究了传统体素方法在高比特深度点云处理中的局限性,提出了一种分阶段的空间到通道(S2C)上下文模型,改进了数据压缩效果并降低了计算复杂性。通过几何残差编码(GRC)和球坐标系统,该方法提高了重建质量,节省了数据位数,展示了在稠密和低级稀疏点云上的应用潜力。

Voxel-based Point Cloud Geometry Compression and Space-to-Channel Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
大数据中的数据压缩:类型与技术

本文讨论了大数据中的压缩技术,包括有损和无损压缩。压缩可以减少数据占用空间,提高传输速度和节省存储成本。无损压缩保留所有数据,而有损压缩则会丢失部分信息。选择合适的压缩方法需考虑数据类型和业务需求。常见技术有RLE、霍夫曼编码和LZW等。

大数据中的数据压缩:类型与技术

DEV Community
DEV Community · 2025-02-25T10:00:00Z
Parquet的两个版本

DuckDB的文章指出,查询引擎对Parquet文件的处理限制了格式的演变,因其未完全支持最新规范。尽管Parquet版本2已确定,但生态系统内的工具未能全面实现,导致兼容性问题。新编码提高了数据压缩效率,但版本2的采用率仍低,兼容性问题尚未解决。

Parquet的两个版本

DEV Community
DEV Community · 2025-02-20T06:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码