本研究提出DenseVLM框架,旨在解决预训练视觉语言模型在密集预测任务中的不足,通过无监督区域语言对齐技术克服前景偏差,从而显著提升目标检测和图像分割的性能。
完成下面两步后,将自动完成登录并继续当前操作。