科学空间|Scientific Spaces ·

DiVeQ：一种非常简洁的VQ训练方案

💡 原文中文，约6300字，阅读约需15分钟。

📝

内容提要

本文介绍了一种新的向量量化训练方案DiVeQ，采用STE技巧，无需额外的Aux Loss，使训练过程更加简洁。DiVeQ在视觉理解和生成中表现出色，解决了传统方法的超参数调节问题。

🎯

❓

DiVeQ的主要创新点是采用新的STE技巧，无需额外的Aux Loss，从而简化了向量量化的训练过程。

传统的VQ训练方法依赖于STE和Aux Loss，后者引入了额外的超参数，导致训练过程不够端到端。

DiVeQ在视觉理解和生成中表现出色，能够有效解决传统方法的超参数调节问题。

DiVeQ在训练过程中保持了前向传递的$q$，同时保留了梯度，而NSVQ在训练和推理阶段不一致。

实验结果显示，DiVeQ的效果优于NSVQ，尽管引入了随机性。

DiVeQ并不解决VQ的所有问题，但可以与其他技术结合以增强效果。

🏷️

全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住
大晓机器人与港中文MMLab推出Kairos-Homeworld，这是首个全屋三维生成与物体级交互框架，利用30万套中国住宅户型数据为机器人提供训练环境。...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
史上最强游戏掌机来了！性能堪比 PS5，但……
坏消息：1 万块#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
国星宇航与腾讯云签署“星算”计划战略合作协议，携手领航AI云服务新生态
成都国星宇航与腾讯云签署战略合作协议，聚焦“星算”AI云服务，推动技术共创与生态建设，深化云服务与AI技术融合，助力数字经济发展。
Winxvideo AI 二十周年限免：视频压缩、本地AI提升画质、防抖
Winxvideo AI 正在进行二十周年限免活动，用户只需提供邮箱即可获取注册码。该软件集视频增强、图片修复、格式转换等功能于一体，支持超分辨率提升、帧...