Ferret-v2是对Ferret的重大升级,具有支持任意分辨率的定位与引用、多粒度视觉编码和三阶段训练模式。实验结果显示,Ferret-v2在高分辨率处理和细粒度视觉理解方面显著优于Ferret及其他先进方法。
完成下面两步后,将自动完成登录并继续当前操作。