本研究提出了一种潜在语言建模(LatentLM)方法,旨在解决多模态生成模型中离散与连续数据的整合问题。通过结合因果变换器和变分自编码器,该方法在图像生成和文本到语音合成方面表现出色。
完成下面两步后,将自动完成登录并继续当前操作。