本研究提出了一种名为MegaPairs的新型数据合成方法,旨在解决多模态检索中的训练数据不足问题。该方法通过视觉语言模型生成大规模合成数据集,显著提升了检索器的性能,超越了基线模型,并具备良好的扩展性。
完成下面两步后,将自动完成登录并继续当前操作。