小红花·文摘 - 小红花技术领袖俱乐部

向量量化是一种数据压缩技术，用于减少高维数据的大小。常用方法有标量量化、二进制量化和乘积量化。标量量化将数据映射为较小的int8类型，减少内存；二进制量化将向量转换为二进制表示，提高速度并减少内存；乘积量化通过子向量和码本实现高压缩率。每种方法在内存、速度和准确性上有不同的权衡。

什么是向量量化？

DEV Community ·

什么是向量量化？

Qdrant - Vector Database ·

本文讨论了在PostgreSQL中使用标量和二进制量化技术进行向量搜索和存储的方法。标量量化可以减小向量维度的大小，而二进制量化将维度减小为一个比特位。文章提供了实现这些技术的示例，并评估了它们对索引构建时间、查询性能和召回率的影响。结果显示，使用2字节浮点数的标量量化是明显的优选，既提供了空间和时间的节省，又不损失性能。二进制量化也可以有效，但其对召回率的影响取决于向量的多样性。总体而言，有效的量化技术可以减小存储和内存占用，实现向量工作负载的可扩展性。

乔纳森·卡茨：用于pgvector向量搜索和存储的标量和二进制量化

Planet PostgreSQL ·

本文探讨了向量量化与标量量化在高清图像压缩中的优劣，提出通过非线性向量变换和多级量化策略来优化速度与性能。研究表明，结合Lattice Vector Quantization（LVQ）和空间自适应扩展（AC）的方法能够在不显著增加复杂度的情况下提升压缩效果。

利用格码变换在神经压缩中接近速率失真限制

BriefGPT - AI 论文速递 ·

本文研究了高清图像压缩中向量量化和标量量化的优劣，并提出了一种新的方案，通过非线性向量变换和多级量化战略解决了向量量化的复杂性问题，采用基于熵的向量量化来确定量化边界，优化速度和性能。

软凸量化：用凸优化重新审视向量量化

BriefGPT - AI 论文速递 ·

本文研究了向量量化和标量量化在高清图像压缩方面的优劣，并提出了一种新的方案：通过非线性向量变换和多级量化战略解决了向量量化的复杂性问题，并采用基于熵的向量量化来确定量化边界，从而优化速度和性能。与现有的基于非线性变换编码的方法相比，该方法具有更好的速度和模型尺寸，研究结果表明该方法性能更佳。

具有时间分层自适应分层 B 帧编码的神经视频压缩

BriefGPT - AI 论文速递 ·

标量量化：背景、实践与更多 | Qdrant

标量量化：背景、实践与更多 | Qdrant

Qdrant - Vector Database ·

向量量化方法

向量量化方法

Qdrant - Vector Database ·