本文介绍了我们在VAND 2023 Challenge中的零样本检测方向的提交结果,通过增强WINCLIP框架的定位能力和整合零样本分割模型,我们在VAND挑战赛中排名第三,实现了VisA数据集上的平均F1-max得分为81.5/24.2。
完成下面两步后,将自动完成登录并继续当前操作。