基于自我训练奖励模型的流畅准确图像描述生成

📝

内容提要

该研究旨在解决传统图像描述模型在使用手工奖励时的描述性和语义丰富性不足问题。提出的Self-Cap方法通过自生成负样本并结合可学习的奖励模型,提高了描述的准确性和丰富性,同时减少了微调时间。实验结果表明,该方法在标准和零样本图像描述数据集上都取得了显著的效果。

➡️

继续阅读