本文提出了一种基于BART和UniMS的多模态摘要框架,结合抽取与生成目标,改进了图像选择。通过构建大规模数据集和新模型,提升了多模态摘要的性能,并建立了新的基准,推动了未来研究的发展。
完成下面两步后,将自动完成登录并继续当前操作。