本研究提出了一种基于模型的图像压缩技术,旨在解决远程操作车辆在水下环境中实时图像传输的瓶颈。该技术利用机器学习的视图合成模型,通过梯度下降优化生成可压缩的图像差异,实验结果表明其在压缩比和图像质量上优于现有方案,具有良好的鲁棒性,推动了远程操作车辆的应用。
本研究通过比较视觉变换器(ViT)与传统卷积神经网络(CNN)架构,解决了侧扫声纳图像中人造物体分类的挑战。结果显示ViT模型在多个分类性能指标上表现更佳,为未来在水下环境中应用ViT提供了新的思路。
该研究利用机器学习和语义分割技术实现了高精度的三维语义地图,可用于水下环境的自动分析和监测,降低了劳动力成本,为保护政策提供了更高效的信息。
该研究评估了多种目标检测模型在高盐度、低可见度的水下环境中的效果,并通过修改EfficientDet实现了对抗性干扰下的复杂特征融合。研究结果显示,修改后的EfficientDet在五倍交叉验证中表现更好,具有更高的IoU。
完成下面两步后,将自动完成登录并继续当前操作。