北京大学的研究团队提出了一种姿势和交互感知的人物交互图像生成框架(SA-HOI),通过利用人体姿势和交互边界区域信息进行去噪过程的指导,生成更合理、更真实的人物交互图像。实验结果表明,该方法在人体生成质量、交互语义表达、人物交互距离等方面优于现有模型。
完成下面两步后,将自动完成登录并继续当前操作。