小红花·文摘

Apple Machine Learning Research ·

本文提出了一种基于3D高斯扩散的新视角合成方法，结合可微渲染框架和空间注意力模块，提升了渲染质量和速度。通过音频与3D场景信息结合，解决了声源定位和分离问题，取得了优异的声学合成效果。此外，FSGS方法实现了实时高质量视角合成，MVSGaussian方法有效重建未见场景，展现出良好的综合性能。

BriefGPT - AI 论文速递 ·