北京大学彭宇新教授团队提出的细粒度多模态大模型Finedefics,解决了多模态大模型在细粒度视觉识别中的不足。通过构建视觉对象的细粒度属性知识和对比学习,Finedefics在多个数据集上的识别准确率平均达到76.84%,显著优于其他模型。
完成下面两步后,将自动完成登录并继续当前操作。