小红花·文摘

ERVQ: 基于内外码本优化的增强残差矢量量化神经音频编解码器 | TASLP2025

实时互动网 ·

本文介绍了一种基于向量量化的图像压缩编码框架，利用VQGAN模型实现高效压缩和优质重构。同时，提出了语言引导的码书学习框架（LG-VQ），以提高多模态任务的性能。研究表明，低秩码簿量化方法（LCQ）在不增加存储成本的情况下，能提升大型语言模型的准确性。此外，提出的多级生成语义通信系统和鲁棒生成模型（RVQ-VAE）在处理异常值和生成特征恢复方面表现优异。

将 VQGAN 的码本大小扩展至 100,000，利用率为 99%

BriefGPT - AI 论文速递 ·

本文提出了一种名为极限波束管理（X-BM）的机器学习算法，旨在优化极大规模多输入多输出（X-MIMO）系统的初始接入和码本设计。该算法在频谱效率上比传统方法提高了8dB，并探讨了基于子阵列的高效分层码簿设计及其在不同系统下的性能评估，结果显示优于现有方法。

神经码本设计用于网络波束管理

BriefGPT - AI 论文速递 ·

QINCo 是一种神经网络 RQ 变体，它通过根据先前步骤的向量逼近条件化地预测每个向量的专门码书，实验证明 QINCo 在多个数据集和码字大小上显著优于现有方法。

通过含蓄的神经网络码本进行残差量化

BriefGPT - AI 论文速递 ·

通过量化多种身体部位的运动为其各自领域定制的码本，利用预训练模型将多模态信号转换为共享的潜在空间，并通过逐步预测后续令牌形成完整序列来将这些信号转换成离散的运动令牌，最后从令牌序列中重构连续的实际运动。研究方法将多模态动作生成挑战框架定义为令牌预测任务，利用基于控制信号模态的专门码本，具有可扩展性，能够轻松整合新的模态。实验证明了设计的有效性并强调了广泛应用的潜力。

OMG：通过混合控制器实现开放词汇的动作生成

BriefGPT - AI 论文速递 ·

该文介绍了一种基于码本的视频压缩框架，通过传输码本的索引序列来实现视频压缩，避免了自回归熵建模，兼顾了计算效率和跨平台性能。

无与伦比的跨平台视频编解码器：基于码本的方法

BriefGPT - AI 论文速递 ·