小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了一种新的向量量化训练方案DiVeQ,采用STE技巧,无需额外的Aux Loss,使训练过程更加简洁。DiVeQ在视觉理解和生成中表现出色,解决了传统方法的超参数调节问题。

DiVeQ:一种非常简洁的VQ训练方案

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-10-08T13:52:00Z
基于向量量化的高效检索优化上下文语音识别

本文提出了一种基于向量量化的交叉注意力近似方法,利用神经上下文偏置提升语音识别模型的转录准确性。该方法通过高效的量化检索模块,从大型偏置目录中快速筛选相关条目,实现个人实体识别中的相对错误率降低71%,同时计算时间减少20%,内存使用降低85-95%。

基于向量量化的高效检索优化上下文语音识别

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-08T00:00:00Z
通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

向量量化是一种将高维嵌入从32位浮点数压缩到低精度格式的技术,能够显著提升性能并保持语义搜索能力。二进制量化速度最快且资源占用最低,标量量化在性能与准确性之间取得平衡,而浮点数则提供最高保真度但成本较高。通过MongoDB Atlas的自动量化,企业可以在处理百万级嵌入时优化计算和内存使用,提升检索效率。

通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

MongoDB
MongoDB · 2025-06-10T14:00:00Z
通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

向量量化是一种将高维嵌入压缩至低精度格式的技术,能够显著提升性能并保持语义搜索能力。二进制量化速度最快且资源占用最低,标量量化在性能与准确性之间取得平衡,而float32提供最高保真度但成本较高。通过MongoDB的自动量化,企业在处理百万级嵌入时可以显著降低内存和计算需求,同时保持语义准确性。

通过MongoDB Atlas量化与Voyage AI嵌入扩展向量搜索

MongoDB
MongoDB · 2025-06-10T14:00:00Z

本研究提出了一种去噪扩散概率模型(DDPM-PCC),用于低比特率点云压缩。该模型通过PointNet编码器生成条件向量,并利用可学习向量量化器进行量化,显著提高了比特率-失真性能,优于现有技术。

Denoising Diffusion Probabilistic Model for Low Bit-Rate Point Cloud Compression

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种新在线算法TurboQuant,旨在解决向量量化中的均方误差和内积失真问题。该算法通过随机旋转输入向量和优化标量量化器,有效保持几何结构。实验结果表明,其在关键值缓存量化和最近邻搜索中优于现有技术。

TurboQuant:近于最优失真率的在线向量量化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究提出了NoWag框架,旨在解决大型语言模型在资源受限环境中的应用问题。NoWag实现了无损形状保留压缩,显著优于现有的向量量化和修剪方法,为未来研究提供了新思路。

NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本文针对传统人工智能代理在突现语言游戏中缺乏内部语言学习能力的问题,提出了一种新方法VQEL,结合向量量化,使代理能够在自我博弈中自主创造和发展离散的符号表示。实验结果表明,VQEL在性能上超越了传统的REINFORCE方法,且通过向量量化提高了控制能力,减少了系统崩溃的可能性。

VQEL:通过向量量化在突现语言游戏中启用自主发展的符号语言

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z
为什么向量量化对人工智能工作负载至关重要

随着向量嵌入规模的扩大,内存使用和查询延迟增加,导致成本上升和用户体验下降。通过低精度格式存储嵌入,可以显著降低内存需求并加快检索速度。MongoDB Atlas简化了压缩向量的创建、存储和索引,支持AI应用的高效扩展。量化技术在保持准确性的同时,压缩高维嵌入,解决了大规模AI工作负载的内存、延迟和成本问题。

为什么向量量化对人工智能工作负载至关重要

MongoDB
MongoDB · 2025-02-27T15:00:00Z

本研究提出了一种名为RVRAE的动态因子模型,结合变分循环自编码器,专注于市场数据的时间依赖性和噪声。RVRAE通过先验-后验学习优化,特别适用于波动性股票市场的风险建模和回报预测。实证测试表明其性能优于其他方法。

STORM:基于双向量量化变分自编码器的时空因子模型用于金融交易

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

该研究提出了一种索引反向传播量化(IBQ)方法,解决了现有向量量化在可扩展性方面的不足,并优化了代码本与视觉编码器的联合训练。实验结果表明,IBQ在视觉生成任务中表现优异。

驯服可扩展的视觉标记器用于自回归图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

VQVAE是一种无监督学习的离散表征方法,结合了自回归模型和生成模型的优点。通过设计离散字典和直通估计器,VQVAE有效建模离散数据,核心在于向量量化和EMA更新字典,支持多尺度特征提取,提升生成效果。

vqvae及其变体代码学习

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2024-11-18T10:13:55Z

本研究提出了一种新方法SimVQ,旨在解决向量量化模型中潜在空间表示崩溃的问题,并优化线性空间。实验结果表明,该方法在多种模态下表现优异。

Solving Representation Collapse in Vector Quantization Models with a Linear Layer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种向量量化元学习方法(MetaRec),旨在提升可转移序列推荐系统的性能。该方法整合多个源领域的用户-物品互动数据,有效解决输入异质性问题,从而显著改善推荐效果。

Transferable Sequential Recommendation via Vector Quantization Meta-Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

我们提出了一种框架,能够通过语音生成真实感的全身虚拟人物姿势,包括面部和手部动作。结合向量量化和扩散技术,该模型生成动态且富有表现力的运动,并利用多视角对话数据集进行研究。实验结果表明,该模型在姿势生成方面优于传统方法,突出了细微运动细节的重要性。

Allo-AVA:一种大规模多模态对话AI数据集用于分视角虚拟化身手势动画

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z
使用MongoDB和AI合作伙伴构建生成式AI | 2024年9月

上周,我参加了伦敦的MongoDB.local活动,发布了与AWS和Anthropic合作的参考架构,支持AI代理的增强记忆。MongoDB Atlas推出了新的向量量化功能,助力语义搜索和生成式AI应用。我们还迎来了包括Arize、Baseten和Doppler在内的七个新AI和技术合作伙伴,提升AI应用开发和部署效率。

使用MongoDB和AI合作伙伴构建生成式AI | 2024年9月

MongoDB
MongoDB · 2024-10-09T18:00:00Z
向量量化:扩展搜索与生成式AI应用

MongoDB Atlas Vector Search推出向量量化功能,减少向量大小同时保持性能,降低成本。支持标量量化向量导入,提升语义搜索和生成式AI应用的扩展性。未来将增加二进制量化支持,进一步节省存储空间。

向量量化:扩展搜索与生成式AI应用

MongoDB
MongoDB · 2024-10-07T14:00:00Z
DeepLearning.AI新课程:检索优化——从分词到向量量化

DeepLearning.AI与Qdrant合作推出新课程《检索优化:从分词到向量量化》,提升开发者的向量搜索能力。课程由Qdrant的Kacper Łukawski主讲,适合有Python基础的初学者,内容包括分词技术和检索优化等,帮助学员优化检索应用。课程免费在线提供,时长一小时。

DeepLearning.AI新课程:检索优化——从分词到向量量化

Qdrant - Vector Database
Qdrant - Vector Database · 2024-10-06T00:02:00Z

向量量化是一种数据压缩技术,用于减少高维数据的大小。常用方法有标量量化、二进制量化和乘积量化。标量量化将数据映射为较小的int8类型,减少内存;二进制量化将向量转换为二进制表示,提高速度并减少内存;乘积量化通过子向量和码本实现高压缩率。每种方法在内存、速度和准确性上有不同的权衡。

什么是向量量化?

DEV Community
DEV Community · 2024-09-27T16:14:21Z
什么是向量量化?

向量量化是一种数据压缩技术,用于减少高维数据的大小,提高存储和搜索效率。主要方法有标量量化、二进制量化和乘积量化。标量量化将浮点数映射为整数,减少内存;二进制量化将向量转为二进制,提高速度和效率;乘积量化通过子向量和质心压缩数据,适合高内存需求。每种方法在速度、精度和压缩率上各有优劣。

什么是向量量化?

Qdrant - Vector Database
Qdrant - Vector Database · 2024-09-25T12:29:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码