本研究提出了MonoASRH框架,旨在解决单目三维目标检测中的全局意识不足和小目标遗漏问题。通过高效的混合特征聚合和自适应尺度感知回归,实验在KITTI和Waymo数据集上取得了优异的表现。
本研究提出了一种基于滑动时间窗口的数据处理方法,用于网络入侵检测系统(NIDS)。该方法仅需十一种特征,能够实现高效的数据聚合,训练准确率超过99%。同时探讨了NIDS的泛化能力及其对不同数据集的影响。
本文提出了多种新型网络结构以提升图像超分辨率性能,包括整体注意力网络、WaveMix架构和混合多轴聚合网络。这些方法通过改进特征聚合和注意力机制,显著提高了超分辨率效果,并在多个数据集上优于现有技术。
本论文介绍了Let Occ Flow,它是第一个仅使用相机输入进行联合3D占用和占用流预测的自监督工作。方法利用TPV和可变形注意力层进行特征聚合,采用前后时间注意模块捕捉动态物体之间的依赖关系,并使用3D精细模块进行体积表示。实验证明了该方法在之前最先进方法上的竞争性表现。
本文提出了一种监控视频中飞鸟对象的检测方法,通过聚合多个连续图像帧上的飞鸟对象的特征,并设计了一个具有大特征图层的检测网络来检测多尺度鸟类对象。实验结果表明该方法有效地提高了飞鸟对象的检测性能。
DFANet是一种高效的卷积神经网络架构,用于资源有限的语义分割。通过特征聚合和多尺度特征传播,DFANet减少了参数数量,提高了学习能力。在实验证明DFANet比现有方法快2倍,FLOPs少8倍,同时提供可比较的准确性。在Cityscapes测试数据集上,IOU平均值为70.3%,仅使用1.7 GFLOPs,在NVIDIA Titan X卡上以160 FPS的速度进行推断。
该文章介绍了DINO-Mix架构,利用DINOv2模型修剪和微调图像,提取鲁棒的特征。通过MLP-Mixer的特征聚合模块,实现全局鲁棒和可泛化的特征描述,从而实现高精度的VPR。实验证明,DINO-Mix在具有光照变化、季节变化和遮挡的测试集上表现优于当前最先进的方法,平均准确率提高了5.14%。
完成下面两步后,将自动完成登录并继续当前操作。