本研究提出了一套自动评估指标,旨在改进图像再创造的评估机制。该指标基于机器翻译,涵盖对象、嵌入和视觉语言模型。研究发现,专有视觉语言模型在文化相关性和语义等价性方面表现最佳,而视觉编码器在视觉相似性测量上表现突出,为图像再创造的自动评估提供了理论和实践框架。
完成下面两步后,将自动完成登录并继续当前操作。