HOTS3D: 超球面最优输运用于文本到三维生成的语义对齐
发表于: 。该论文提出了使用球面最优传输对齐文本特征和图像特征的方法,以有效地生成符合输入文本的三维形状。通过使用 Villani 的定理以及输入凸神经网络,该方法在高维情况下解决了球面最优传输的挑战,并通过扩散生成器和 Nerf 解码器将特征转换为三维形状,展现了在三维形状生成方面的优越性,尤其是与文本语义的一致性。
该论文提出了使用球面最优传输对齐文本特征和图像特征的方法,以有效地生成符合输入文本的三维形状。通过使用 Villani 的定理以及输入凸神经网络,该方法在高维情况下解决了球面最优传输的挑战,并通过扩散生成器和 Nerf 解码器将特征转换为三维形状,展现了在三维形状生成方面的优越性,尤其是与文本语义的一致性。