麻省理工学院研究人员提出了一种新方法,利用视频追踪数据提升视觉语言模型(VLM)在图像中定位个性化物体的能力,如宠物。这种方法提高了定位准确性,为未来AI在物体追踪和辅助技术方面的应用提供了可能性。
完成下面两步后,将自动完成登录并继续当前操作。