本文提出了分层量化变分自动编码器(HQ-VAE)和鲁棒生成模型(RVQ-VAE),有效解决了分层 VQ-VAE 的层级坍塌问题,提升了重建性能。通过动态量化和在线聚类学习,改进了图像生成质量,并在视觉和语音任务中展示了其优势。
完成下面两步后,将自动完成登录并继续当前操作。