本研究提出了一种整合语言类别嵌入和查询嵌入的方法,以解决多数据集图像分割中的语义不一致问题。实验结果表明,该方法在语义分割、全景分割和实例分割方面优于以往技术,显著提升了处理不一致标签的性能。
本研究使用语言嵌入进行自动驾驶数据集的主动学习,重点关注新颖性检测。通过对比语言-图像预训练嵌入对数据集进行聚类实验,有效地分离出新颖场景。进一步提出了生成用于区分新颖场景与其他场景的文本解释的方法,并讨论了安全接管、数据整理和多任务主动学习的潜在应用。
完成下面两步后,将自动完成登录并继续当前操作。