澳鹏数据推出RoboGo具身智能数据开发平台,旨在解决高质量训练数据稀缺问题。该平台结合多项技术,提供精准目标识别、高精度3D点云、视频内容解析及物理因果链学习,支持智能体在复杂环境中的认知与任务规划。
TrackVLA是一种集成目标识别与轨迹规划的视觉-语言-动作模型,旨在解决具身视觉跟踪任务。通过联合训练,该模型在动态环境中展现出优越的识别与规划能力,提升了智能体在复杂场景中的跟踪效果。
本研究提出了动态环境中目标识别的新定义,旨在提升实时目标识别系统的能力,采用无模型强化学习方法,展示了快速适应变化任务的能力。
本研究提出了一种名为GRAML的方法,将目标识别视为深度度量学习任务,从而解决了手动模型构建的问题。GRAML能够在仅有一个示例的情况下,快速且准确地识别新目标,展现出比现有技术更高的速度和灵活性。
本研究提出了一种多任务平衡通道注意力卷积神经网络(MT-BCA-CNN),旨在解决水下声学目标识别中的样本匮乏和环境干扰问题。该模型结合了通道注意力机制和多任务学习,优化了目标分类与特征重建。实验结果表明,MT-BCA-CNN在27类少样本场景下实现了97%的分类准确率和95%的F1分数,优于传统方法。
合成孔径雷达(SAR)是一种重要的对地观测技术,目标识别(ATR)是其核心问题。目前,SAR目标识别面临技术和生态挑战。国防科技大学团队提出了SARATR-X 1.0基础模型,利用自监督学习和创新框架提升目标识别能力,并致力于建立开源生态以推动技术发展。
本研究提出了一种新方法LRSAA,结合YOLOv11与MobileNetV3-SSD算法,解决大面积遥感图像的目标识别与自动标注问题,优化计算资源需求,实现准确性与速度的平衡。
本研究提出了一种新方法,针对水下声学目标识别中的不稳定性问题,通过设计辅助任务建模环境影响因素,并整合到对抗性多任务框架中,以提升模型的鲁棒性。研究结果显示,该方法在12类目标识别任务中表现优异。
本研究提出了一种名为M3的框架,利用多任务学习和多门混合专家方法,解决水下声学目标识别中真实信号录音不足的问题,显著提升了模型在复杂声学信号处理中的泛化能力和性能。
AIxiv专栏报道了一项研究,探讨如何利用大型预训练模型的幻觉来减少对手动提示的依赖。研究团队开发了ProMaC框架,能够在复杂任务中准确识别目标的位置和形状,展示了幻觉的潜在价值。
该研究提出了一种快速的数据依赖初始化过程,避免了梯度问题,并与现有预训练方法相匹配。通过扰动层替代卷积层,提升了视觉数据集的性能。研究探讨了预训练与微调的关系,提出了多任务预训练方法,显著提高了图像分类和目标识别的精度。此外,研究提出了统一语言界面,将计算机视觉任务转化为文本生成问题,展示了模型在多任务学习中的优越性。
该研究探讨了深度学习在合成孔径雷达(SAR)自动目标识别中的应用,提出了对比特征对齐(CFA)和加权损失半监督生成对抗网络(WL-SSGAN)等新方法,提升了模型在不熟悉环境中的识别能力。同时,介绍了基于图神经网络的低计算复杂度目标识别方法及SAR-Net框架,验证了其在目标检测中的有效性和鲁棒性。此外,研究还涉及不确定性感知系统和对抗训练技术,展示了在多种场景下的优越性能。
本文探讨了无人机图像中的目标识别和检测技术,提出了图像金字塔尺度归一化检测器(SNIP)、干扰解缠特征转换(NDFT)算法和基于梯度分离的堆叠互补损失(SCL)方法。这些方法在不同数据集上表现优异,特别是在小目标检测和尺度不平衡问题上取得了显著进展。
本文提出了一种基于算子计数框架的目标识别方法,能够有效处理噪声观测并提高识别准确性。实证评估表明,该方法在一致性和性能上优于传统方法,适用于真实场景,推动了目标识别领域的研究进展。
本研究提出了EventNet和EventSR等基于事件流的神经网络技术,旨在实时处理异步事件并重建高质量图像。这些方法利用新型视觉传感器和先进学习技术,显著提升了图像分辨率和处理效率,适用于目标识别和视频重构等应用。
该论文探讨了事件相机与标准相机的互补性在低延迟视觉特征跟踪中的应用,提出了多种基于事件流的图像重建和对象分类技术,展示了在光流估计和目标识别方面的显著改进,并介绍了ADΔER软件套件用于事件驱动视频的研究。
该研究提出了一种对比特征对齐(CFA)解决方案,通过联合分类损失和通道加权平均平方误差训练模型,以提高目标识别的稳健性。实验表明,在MSTAR数据集上,利用少量标注样本和未标注样本的半监督框架有效提升了识别性能。此外,结合对抗训练和自监督学习的方法在多种数据集上取得了最佳性能,增强了模型的鲁棒性。
本文提出了一种双流框架方法,结合多类关注区域模块(MCAR)和注视模型,以提高多类别目标识别和语义分割的准确性。该方法在多个数据集上表现优异,展示了深度学习在图像处理中的应用潜力。
本文提出了一种结合模型强化学习和目标识别的框架,解决了目标识别中的手动设计和在线计算问题,展示了在标准和嘈杂环境中的优异性能。研究探讨了基于两层分层强化学习的任务解决方法和高效的在线目标识别技术,强调了数据驱动方法和优化框架在真实场景中的应用效果。
本文介绍了自主驾驶的两种算法:深度学习和自适应神经符号网络。研究结合目标识别与跟踪技术,利用雷达传感器提高物体识别性能,并提出符号化同时定位与建图的新方法,增强环境分类能力。通过神经符号集成系统,改善了深度学习的推理任务,提升了模型在人体活动识别和运动预测中的准确性和性能。
完成下面两步后,将自动完成登录并继续当前操作。