小红花·文摘

本研究提出DenseVLM框架，旨在解决预训练视觉语言模型在密集预测任务中的不足，通过无监督区域语言对齐技术克服前景偏差，从而显著提升目标检测和图像分割的性能。