小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Qdrant中的TurboQuant

Qdrant 1.18引入了TurboQuant,这是一种新的基于旋转的向量量化方法,提供8x、16x和32x的压缩率。与标量量化和二进制量化相比,TurboQuant在存储效率和召回率上表现更佳。建议用户在测试数据上尝试TurboQuant配置,以实现更高的召回率和更低的存储需求。该方法无需数据集训练,适用于各种嵌入模型。

Qdrant中的TurboQuant

Qdrant - Vector Database
Qdrant - Vector Database · 2026-05-13T08:00:00Z

本文介绍了一种新的向量量化训练方案DiVeQ,采用STE技巧,无需额外的Aux Loss,使训练过程更加简洁。DiVeQ在视觉理解和生成中表现出色,解决了传统方法的超参数调节问题。

DiVeQ:一种非常简洁的VQ训练方案

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-10-08T13:52:00Z
基于向量量化的高效检索优化上下文语音识别

本文提出了一种基于向量量化的交叉注意力近似方法,利用神经上下文偏置提升语音识别模型的转录准确性。该方法通过高效的量化检索模块,从大型偏置目录中快速筛选相关条目,实现个人实体识别中的相对错误率降低71%,同时计算时间减少20%,内存使用降低85-95%。

基于向量量化的高效检索优化上下文语音识别

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-08T00:00:00Z
通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

向量量化是一种将高维嵌入从32位浮点数压缩到低精度格式的技术,能够显著提升性能并保持语义搜索能力。二进制量化速度最快且资源占用最低,标量量化在性能与准确性之间取得平衡,而浮点数则提供最高保真度但成本较高。通过MongoDB Atlas的自动量化,企业可以在处理百万级嵌入时优化计算和内存使用,提升检索效率。

通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

MongoDB
MongoDB · 2025-06-10T14:00:00Z
通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

向量量化是一种将高维嵌入压缩至低精度格式的技术,能够显著提升性能并保持语义搜索能力。二进制量化速度最快且资源占用最低,标量量化在性能与准确性之间取得平衡,而float32提供最高保真度但成本较高。通过MongoDB的自动量化,企业在处理百万级嵌入时可以显著降低内存和计算需求,同时保持语义准确性。

通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

MongoDB
MongoDB · 2025-06-10T14:00:00Z

本研究提出了一种去噪扩散概率模型(DDPM-PCC),用于低比特率点云压缩。该模型通过PointNet编码器生成条件向量,并利用可学习向量量化器进行量化,显著提高了比特率-失真性能,优于现有技术。

Denoising Diffusion Probabilistic Model for Low Bit-Rate Point Cloud Compression

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种新在线算法TurboQuant,旨在解决向量量化中的均方误差和内积失真问题。该算法通过随机旋转输入向量和优化标量量化器,有效保持几何结构。实验结果表明,其在关键值缓存量化和最近邻搜索中优于现有技术。

TurboQuant:近于最优失真率的在线向量量化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究提出了NoWag框架,旨在解决大型语言模型在资源受限环境中的应用问题。NoWag实现了无损形状保留压缩,显著优于现有的向量量化和修剪方法,为未来研究提供了新思路。

NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本文针对传统人工智能代理在突现语言游戏中缺乏内部语言学习能力的问题,提出了一种新方法VQEL,结合向量量化,使代理能够在自我博弈中自主创造和发展离散的符号表示。实验结果表明,VQEL在性能上超越了传统的REINFORCE方法,且通过向量量化提高了控制能力,减少了系统崩溃的可能性。

VQEL:通过向量量化在突现语言游戏中启用自主发展的符号语言

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z
为什么向量量化对人工智能工作负载至关重要

随着向量嵌入规模的扩大,内存使用和查询延迟增加,导致成本上升和用户体验下降。通过低精度格式存储嵌入,可以显著降低内存需求并加快检索速度。MongoDB Atlas简化了压缩向量的创建、存储和索引,支持AI应用的高效扩展。量化技术在保持准确性的同时,压缩高维嵌入,解决了大规模AI工作负载的内存、延迟和成本问题。

为什么向量量化对人工智能工作负载至关重要

MongoDB
MongoDB · 2025-02-27T15:00:00Z

该研究提出了多种创新的金融市场分析方法,包括RVRAE动态因子模型、LLMFactor框架和AlphaForge因子生成框架,旨在提高股票收益预测的准确性和有效性。通过深度学习和自编码器技术,克服了传统模型在处理非线性和高噪声数据时的不足,实证测试表明这些新方法在金融时间序列预测中表现优越。

STORM:基于双向量量化变分自编码器的时空因子模型用于金融交易

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

该研究提出了一种索引反向传播量化(IBQ)方法,解决了现有向量量化在可扩展性方面的不足,并优化了代码本与视觉编码器的联合训练。实验结果表明,IBQ在视觉生成任务中表现优异。

驯服可扩展的视觉标记器用于自回归图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

VQVAE是一种无监督学习的离散表征方法,结合了自回归模型和生成模型的优点。通过设计离散字典和直通估计器,VQVAE有效建模离散数据,核心在于向量量化和EMA更新字典,支持多尺度特征提取,提升生成效果。

vqvae及其变体代码学习

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2024-11-18T10:13:55Z

本研究提出了一种新方法SimVQ,旨在解决向量量化模型中潜在空间表示崩溃的问题,并优化线性空间。实验结果表明,该方法在多种模态下表现优异。

Solving Representation Collapse in Vector Quantization Models with a Linear Layer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种向量量化元学习方法(MetaRec),旨在提升可转移序列推荐系统的性能。该方法整合多个源领域的用户-物品互动数据,有效解决输入异质性问题,从而显著改善推荐效果。

Transferable Sequential Recommendation via Vector Quantization Meta-Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
使用MongoDB和AI合作伙伴构建生成式AI | 2024年9月

上周,我参加了伦敦的MongoDB.local活动,发布了与AWS和Anthropic合作的参考架构,支持AI代理的增强记忆。MongoDB Atlas推出了新的向量量化功能,助力语义搜索和生成式AI应用。我们还迎来了包括Arize、Baseten和Doppler在内的七个新AI和技术合作伙伴,提升AI应用开发和部署效率。

使用MongoDB和AI合作伙伴构建生成式AI | 2024年9月

MongoDB
MongoDB · 2024-10-09T18:00:00Z
向量量化:扩展搜索与生成式AI应用

MongoDB Atlas Vector Search推出向量量化功能,减少向量大小同时保持性能,降低成本。支持标量量化向量导入,提升语义搜索和生成式AI应用的扩展性。未来将增加二进制量化支持,进一步节省存储空间。

向量量化:扩展搜索与生成式AI应用

MongoDB
MongoDB · 2024-10-07T14:00:00Z
DeepLearning.AI新课程:检索优化——从分词到向量量化

DeepLearning.AI与Qdrant合作推出新课程《检索优化:从分词到向量量化》,提升开发者的向量搜索能力。课程由Qdrant的Kacper Łukawski主讲,适合有Python基础的初学者,内容包括分词技术和检索优化等,帮助学员优化检索应用。课程免费在线提供,时长一小时。

DeepLearning.AI新课程:检索优化——从分词到向量量化

Qdrant - Vector Database
Qdrant - Vector Database · 2024-10-06T00:02:00Z

本文介绍了一种新的离散扩散概率模型,利用无约束的Transformer架构实现向量量化标记的并行预测,从而提升图像生成的质量和多样性。研究中提出了Token-Critic辅助模型和正则化的向量量化框架,显著改善了生成效果。此外,SEED和MAGVIT-v2等新技术展示了大型语言模型在图像和视频生成中的优势,并提出了TiTok和Open-MAGVIT2等新方法,优化了图像生成过程,推动了该领域的创新。

图像文件夹:折叠标记的自回归图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文提出了一系列优化3D高斯点云渲染的方法,包括学习性掩码策略、向量量化和因式化技术。这些方法显著减少了存储需求,提高了渲染质量,并在静态和动态场景中实现了高效的新视图合成,提升了重建质量和一致性,解决了高内存占用的问题。

3DGS-DET:利用边界指导和聚焦采样增强3D高斯溅射的3D目标检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码