AIxiv专栏促进学术交流,报道超过2000篇内容。香港大学与华为合作提出高效扩散模型LiT,利用简化线性注意力在离线状态下快速生成1K分辨率图像,展示其在文生图任务中的潜力。
本研究提出了一种名为GRIN的高效扩散模型,解决了单幅图像进行3D重建时的尺度模糊问题。该方法通过图像特征与3D几何位置编码相结合,展示了新的零-shot标准单目深度估计的最佳性能。具有重要的潜在应用价值。
完成下面两步后,将自动完成登录并继续当前操作。