本研究提出VerbDiff模型,旨在解决文本到图像扩散模型在生成交互图像时的偏见问题。该模型能够更好地捕捉语义,生成高质量图像,实验结果表明其在复杂交互处理上优于传统方法。
完成下面两步后,将自动完成登录并继续当前操作。