本文研究了显著性视觉关注与物体引用的一致性,提出了一种基于显著性的图像标题生成模型。研究表明,该模型在未知数据上表现更佳,并通过引入人类注意力知识,增强了计算机视觉模型的可解释性和可靠性。此外,提出的新型损失函数CYBORG显著提高了模型的准确性和泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。