本研究提出了TdAttenMix,通过结合人类注视信息改进CutMix方法,有效解决标签不一致问题。实验结果表明,其在八个基准测试中优于现有方法。
通过研究人类注视和深度神经网络注意力机制之间的相互作用,提出了一种新的注视辅助图像字幕模型,能够改善图像字幕性能,并提高语义场景理解的任务。
完成下面两步后,将自动完成登录并继续当前操作。