本研究提出了一种新型视觉标记器V2Flow,旨在解决传统视觉标记技术的不足。V2Flow通过流匹配将视觉标记与大型语言模型词汇结合,实现高保真重构和自回归视觉生成。实验结果表明,V2Flow在生成质量和标记整合方面优于主流VQ标记器,具有重要应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。