小红花·文摘

本文研究了显著性视觉关注与物体引用的一致性，提出了一种基于显著性的图像标题生成模型。研究表明，该模型在未知数据上表现更佳，并通过引入人类注意力知识，增强了计算机视觉模型的可解释性和可靠性。此外，提出的新型损失函数CYBORG显著提高了模型的准确性和泛化能力。