该研究提出了MoTaDual框架,旨在解决复合图像检索中的高成本和零-shot能力不足的问题。通过模态-任务双重对齐,显著提升了检索性能,降低了训练时间和计算成本。实验结果表明,该框架在多个基准测试中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。