基于城市规划需求,开发了多模态多任务的VQA数据集(EarthVQA),旨在推动基于关系推理的判断、计数和综合分析。SOBA框架以物体为中心,提出了语义物体感知的方法,通过对象语义生成和对象引导的注意力,以及双向交叉注意力,对复杂关系推理进行了先进的视觉问答模型优化。实验证明,SOBA优于现有的通用和遥感方法,该数据集和框架为地球视觉的复杂分析提供了一个强大的基准。
该研究提出了一种基于非静态多臂赌博机的折扣汤普森采样的多模态多任务对话行为分类任务的任务选择和分配方法。实验结果表明,该方法相比单任务和多任务基线模型在 UAR 和 F1 方面显著优越,对于数据不平衡问题的数据集具有显著更高的稳定性,并且能够获得一致且良好的少数类性能。
该研究提出了一种基于非静态多臂赌博机的折扣汤普森采样的多模态多任务对话行为分类任务的任务选择和分配方法。实验结果表明,该方法在不同的训练阶段可以有效地识别任务效用,并在训练过程中主动避免无用或有害的任务。相比单任务和多任务基线模型在 UAR 和 F1 方面显著优越,P 值小于 0.05。此外,该方法对于数据不平衡问题的数据集具有显著更高的稳定性,并且能够获得一致且良好的少数类性能,相较于当前最先进的模型,该方法更为优越。
完成下面两步后,将自动完成登录并继续当前操作。