小红花·文摘

本研究提出了一种潜在语言建模（LatentLM）方法，旨在解决多模态生成模型中离散与连续数据的整合问题。通过结合因果变换器和变分自编码器，该方法在图像生成和文本到语音合成方面表现出色。