本研究提出了一种潜在语言建模(LatentLM)方法,旨在解决多模态生成模型中离散与连续数据的整合问题。通过结合因果变换器和变分自编码器,该方法在图像生成和文本到语音合成方面表现出色。
该论文提出了一种通用框架,用于合成复杂的数据结构,包括复合和嵌套类型。通过因果变换器构建了实际解决方案,对结构和列表进行了处理。实验结果表明,该方法在机器学习和统计方面优于当前最先进的模型,并在多重嵌套和稀疏数据集上表现出强大的结果。
完成下面两步后,将自动完成登录并继续当前操作。