GenZI是一种零样本方法,用于生成3D人与场景的交互。它利用大型视觉-语言模型从二维人-场景组合的语义空间中提取交互先验知识,并通过迭代优化过程合成场景中的3D人模型的姿态和形状。与传统方法相比,GenZI不需要捕获3D交互数据,可以通过简单的文字提示进行灵活控制。实验证明该方法适用于各种场景类型。
本文提出了一种自动提示优化方法,用于以情绪为条件的文本生成。通过迭代优化过程改变提示,实现情感条件。将生成文本中情感条件的实现度量作为目标函数,将该方法应用于以情绪为条件的文本生成,并与手动设计的提示进行比较。优化的提示在实现情感条件方面达到了0.75的宏平均F1,手动设计的提示仅达到了0.22的宏平均F1。
完成下面两步后,将自动完成登录并继续当前操作。