本研究提出了Diffleop模型,针对深度学习三维生成模型在优化过程中未充分考虑蛋白-配体结合亲和力的问题。结果表明,Diffleop在多个指标上优于基线模型,尤其在结合亲和力方面表现突出。
本研究提出了一种小波潜在扩散(Wala)方法,旨在解决大规模三维生成模型在细节和复杂几何形状表现不足的问题。该方法通过小波编码实现高达2427倍的压缩比,显著提高训练效率,并生成高质量的三维形状,展现出先进的性能。
我们提出了DynaVol-S,一个三维生成模型,能够在可微分的体素渲染框架中实现基于物体的学习。通过体素化物体中心来捕捉场景的三维特性,并通过反向渲染管道中的组合NeRF来优化这些体素特征。我们的方法整合二维语义特征,创建三维语义网格,通过多个解耦的体素网格来表示场景。DynaVol-S在动态场景的新视图合成和无监督分解任务中明显优于现有模型,通过同时考虑几何结构和语义特征,它有效地应对复杂物体交互的实际场景。此外,训练完成后,这些有明确意义的体素特征还使得我们能够实现2D场景分解方法无法实现的额外功能,比如通过编辑几何形状或操纵物体的运动轨迹来生成新的场景。
该文介绍了一种新的细粒度基准,用于推动文本条件下的三维生成模型的研究。该方法通过自动改进与形状关联的文本描述,并提出了一个量化指标来评估文本与形状的一致性。
完成下面两步后,将自动完成登录并继续当前操作。