逐步语言引导的多任务视觉定位学习

📝

内容提要

本研究针对现有的多任务视觉定位方法的不足之处,提出了一种逐步语言引导的视觉学习框架(PLVL),旨在更有效地提取视觉特征并利用语言信息。研究表明,PLVL框架在不同任务间的协作预测提高了定位精度,显著优于传统方法。

🏷️

标签

➡️

继续阅读