本研究提出了一种新方法,针对水下声学目标识别中的不稳定性问题,通过设计辅助任务建模环境影响因素,并整合到对抗性多任务框架中,以提升模型的鲁棒性。研究结果显示,该方法在12类目标识别任务中表现优异。
本文介绍了ATRank框架,利用注意力机制建模用户行为,以提升推荐系统的性能和训练速度。研究提出了ETA局部敏感哈希、RACP上下文感知模型和BatchRL-MTF多任务框架等方法,旨在提高用户满意度和参与度,优化推荐效果。
本文介绍了一种新型深度学习架构,专注于隐喻的捕捉与生成。研究表明,该架构在隐喻识别和生成方面优于现有方法,尤其在流利度和创造性上表现突出。此外,提出了多任务隐喻生成框架,以解决数据稀缺问题,并展示了大型语言模型与扩散模型的协作潜力。
本文探讨了通过低成本主观质量标注改进图像质量评估模型的方法,提出了多任务框架、最大似然估计和半监督学习等技术,以提高评估准确性和处理不良数据的能力。研究表明,这些方法在多个数据集上表现优越,有效解决评估者偏差,提升图像质量评估性能。
本文介绍了HEDNet,一种用于3D目标检测的编码-解码网络,能够有效捕捉特征间的长距离依赖关系,从而提升大型物体的检测准确性。同时,研究提出了多任务框架BEVerse,结合多相机系统进行三维感知和预测,显著提高了3D物体检测和语义地图构建的性能。
该研究提出了名为Av-CONV的多模态、多任务框架,用于预测第一人称视角下摄像机佩戴者和其他社交伙伴的对话行为。通过自注意机制建模跨时间、跨主体和跨模态的表征。实验证明了该方法在具有多说话者和多对话情景的挑战性视频数据集上的优越性能。消融研究评估了模型中每个组件的贡献。
该研究提出了一种多任务框架,联合执行三维物体检测和全景分割,利用分割信息指导检测过程,解决每个投影视图的缺陷,并通过前景语义信息和中心密度热力图来提示物体的可能框中心位置。实验表明,该方法在 nuScenes 数据集上取得了显著的性能提升,基于单级 CenterPoint 3D 物体检测网络的所提出方法在 nuScenes 3D 检测基准上取得了 67.3 NDS 的最新性能。
VADEC是一种多任务框架,用于情感分析,性能超过了最强基线,在多个数据集上表现出了显著提高。在COVID-19 tweet的案例研究中,该框架证明了其有效性。
本文提出了一种新颖的多任务框架ExpLTV,可以统一进行LTV预测和游戏鲸鱼检测。ExpLTV通过设计游戏鲸鱼探测器,识别高消费者和低消费者,并将其作为门控网络来决定LTV专家组装的不同混合模式,从而充分利用共享信息和特定于场景的信息。最后,设计了一个共享估计器来保留内部任务关系。通过实验验证了ExpLTV的优越性。
本文介绍了一种通过引入GOPro模型,结合CLIP和SSL的优势,在多任务框架中克服了损失加权和CLIP输出空间中不一致的挑战的方法。通过一种统一的学习框架,在图像和文本的共享嵌入空间中确保了输入图像的各种增强视图之间的相似性,从而提高了领域泛化任务的性能。
完成下面两步后,将自动完成登录并继续当前操作。