伊利诺伊大学的研究人员开发了InstructG2I,通过图上下文感知扩散模型解决多模态属性图在图像生成中的挑战。该方法使用Graph-QFormer架构和个性化PageRank进行图采样,生成符合文本提示的图像。在多个数据集测试中,InstructG2I在CLIP和DINOv2得分上优于基线模型。
本文介绍了三种新型图学习模型:自适应图编码器(AGE)、EDGE扩散生成图模型和潜在图扩散(LGD)。AGE通过拉普拉斯平滑滤波器优化节点嵌入,EDGE模型提升了图的稀疏性和生成质量,而LGD框架实现了节点、边和图的统一生成与预测,展现出在多个任务中的优越性能。
完成下面两步后,将自动完成登录并继续当前操作。