计算机视觉中的分割不仅是将图像切割成片段,更是为每个像素赋予意义。主要有四种分割类型:图像分割、语义分割、实例分割和全景分割。这些方法在细节和理解上各有不同,广泛应用于自动驾驶、医学成像和增强现实等领域。
本研究提出了SpikeVideoFormer,一种高效的脉冲驱动视频变换器,采用汉明注意力和线性时间复杂度。该模型在视频分类、人类姿态跟踪和语义分割等任务中表现优越,显著提升了脉冲神经网络的能效和性能。
该研究推出了名为MESSI的多高度语义分割图像数据集,包含2525幅无人机拍摄的城市图像,旨在解决数据不足问题并提供标准化评估基准。
本研究提出了一种名为ClassWise-CRF的类别特定融合架构,旨在提升遥感影像的语义分割精度。该架构通过选择表现优异的专家网络进行分类预测融合,并动态调整权重,验证了其在两个遥感数据集上的有效性。
本文介绍了Turin3D数据集,覆盖都灵市中心约1.43平方公里,包含近7000万个点,旨在解决城市建模中的标签稀缺问题。通过比较多种点云语义分割模型的性能并应用半监督学习技术,显著提升了模型表现。该数据集将公开发布,推动户外点云分割研究的发展。
本研究提出了一种可转移掩码变换器(TMT),旨在解决预训练视觉变换器在新目标域适应时性能下降的问题。该方法通过空间可转移性分析提升跨域表示的对齐,在语义分割任务中MIoU平均提升2%。
Co-SemDepth是一种实时系统,能够同时进行语义分割和深度估计,处理速度达到111 FPS。该系统在NVIDIA Jetson Orin AGX上运行,采用共享编码器和特定任务解码器,显著提升了计算效率,超越了单任务模型。
本研究探讨了如何有效提示视觉-语言模型进行语义分割,并评估不同提示对模型性能的影响。结合文本与视觉提示显著提升了模型性能,提出的PromptMatcher在少样本语义分割中表现优异。
本研究提出了一种新颖的上下文感知语义分割框架,结合大型语言模型与先进视觉网络,解决了现有模型在捕获对象间上下文和语义关系的不足。该模型在像素级精度和上下文理解上优于现有方法,推动了自主驾驶、医学影像和机器人等智能视觉系统的发展。
本研究探讨了关键值变换器(KV Transformer)在语义分割中的应用,旨在解决变换器的计算复杂性和数据依赖性问题。研究表明,KV 变换器在降低模型复杂性的同时,能保持与传统实现相似的性能,适用于医学成像等需要局部推理的场景。
本研究针对无人驾驶飞行器在低空环境中的几何和语义信息理解问题,提出了一种联合深度学习架构,能够快速且准确地进行深度和语义分割。实验结果显示,该方法在MidAir和Aeroscapes数据集上表现优异,预测速度达到20.2帧每秒。
本研究提出了一种NTN方法,解决了激光雷达语义分割在恶劣天气下对“事物”类别预测不准确的问题,通过特征绑定和正则化显著提升了准确性和鲁棒性。
本研究提出了一种连续值嵌入框架,以提高语义分割的准确度。该方法通过将语义掩码生成重构为连续的图像到嵌入的扩散过程,保留细粒度空间和语义细节,消除对离散潜在表示的需求。实验结果表明,该方法在应对分布变化和噪声适应能力方面表现优越,具有显著的鲁棒性。
本研究提出LangDA方法,解决无监督领域自适应语义分割中的知识转移和空间关系捕捉问题。实验结果表明,该方法在DASS基准测试中表现优异,超越了以往的技术。
本研究综述了点云语义分割方法,针对自动驾驶的环境理解需求,提出了三种主要分类:基于投影、基于3D和混合方法。强调了数据集和合成数据的重要性,为未来研究提供了方向,并比较了不同方法的分割准确性和效率。
本研究提出CleverDistiller框架,旨在简化自监督跨模态知识蒸馏过程。该框架实现了2D到3D的知识转移,显著提升了语义分割和3D物体检测的性能,尤其在数据量较少的情况下表现突出。
地瓜机器人与中科院合作提出MODEST框架,通过单张RGB图像实现透明物体的深度估计和语义分割,显著提升抓取精度并降低成本。该技术已入选ICRA 2025,适用于智能工厂等场景。
本研究提出COARSE框架,解决自主越野导航中因缺乏密集标注语义数据导致的领域泛化问题。通过结合稀疏粗略标签和密集外部标签,采用协作伪标记策略,显著提高越野语义分割的准确性。实验结果表明,该方法在多个数据集上表现优异,适用于真实环境。
本研究提出了一种新的邻域占用掩码自编码器(NOMAE),旨在解决LiDAR点云自监督学习中的大面积空白问题。NOMAE通过在非掩码体素邻域内进行占用重建,有效克服了信息泄漏和计算复杂性。研究结果表明,该方法在语义分割和3D目标检测任务中表现优异,具有重要影响。
本研究提出了一种新方法,通过分析光谱信息来提高自动驾驶中的语义分割准确性。利用深度神经网络的激活和权重数据,可以更好地捕捉输入特征与预测之间的关系,从而增强系统在真实驾驶条件下的鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。