T-Rex是一种交互式物体计数模型,能够在零样例情况下进行开放集物体检测。研究提出了新的视觉提示方法和可扩展的对象检测流程,利用预训练模型和自我训练技术显著提高新类别的检测性能。此外,结合视觉和自然语言的神经架构B2T2在推理基准测试中表现优异,减少了错误率。
完成下面两步后,将自动完成登录并继续当前操作。