TIPCap是一种基于文本数据的图像标题生成方法,通过减少对配对数据的依赖性、构建驱动多变量高斯分布的映射模块以缓解模态差异,并在生成标题之前引入可选的提示信息,优于其他弱监督或无监督的方法,并在常用数据集上达到了最优性能。
完成下面两步后,将自动完成登录并继续当前操作。