本研究提出了一种混合注意力-曼巴框架(HAMF),旨在解决自主驾驶系统中的运动预测信息降级问题。通过共同编码场景上下文与未来运动状态,HAMF提高了运动预测的准确性和多样性。实验结果表明,该模型在Argoverse 2基准测试中表现优异。
本研究提出了一种自监督框架,用于空间物体行为特征化,解决了行为分析基础模型不足的问题。该模型基于光曲线,能够有效进行异常检测和运动预测,支持空间安全与可持续性监测。
本研究提出了一种基于图注意力网络的GAMDTP模型,旨在提高自动驾驶系统中交通参与者的运动预测准确性。该模型在Argoverse数据集上实现了领先的动态轨迹预测性能。
本研究提出了MoFlow模型,旨在解决人类轨迹预测问题。该模型基于历史轨迹和上下文信息进行多模态未来运动预测。实验结果表明,MoFlow在生成多样合理轨迹方面表现优异,采样速度比教师模型快100倍。
本研究提出CoT-Drive,通过大型语言模型和链式思维提示,提升自动驾驶中的运动预测准确性。采用知识蒸馏策略,将场景理解能力转移至轻量级模型,实现实时操作,显著增强复杂交通环境中的预测准确性和鲁棒性。
本文介绍了清华大学等机构的研究成果《基于扩散模型的自动驾驶规划》。该算法创新性地设计了自动驾驶规划架构,能够高效处理复杂场景,联合建模周围车辆运动预测与自车规划,降低对后处理的依赖,提升泛化能力与实用性。
本研究提出了一种新颖的并行多尺度增量预测框架(PMS),旨在提高人机协作中人类运动预测的准确性。通过多时空尺度建模,PMS显著提升了16.3%-64.2%的预测准确性,增强了运动的连续性和生物力学一致性。
本研究针对自动驾驶中的复杂城市场景运动预测问题,提出了一种混合训练策略,通过伪标签数据进行模型预训练,再在标注数据上进行精调。实验结果表明,该方法显著提升了模型性能和泛化能力。
本研究提出了一种基于PointNet的多模态运动预测方法,旨在提高城市密集区域中自主车辆的安全性。通过整合局部LiDAR特征,预测精度显著提升。在Waymo开放数据集上的评估中,minADE和mAP分别提高了6.20%和1.58%。
LaserFlow是一种高效的3D物体检测和运动预测方法,利用LiDAR的局部视图,无需数据体素化或压缩。它采用多次扫描融合和基于课程学习的概率分布技术。在两个自动驾驶数据集上表现出色。
视频外推技术(VERT)能够让观众从新的视角观看预测的三维场景。通过将二维场景映射到三维点云,VERT能够高质量地渲染未来的视频。实验结果显示VERT在运动预测方面表现出优越性能。
该研究介绍了一种多粒度转换器(MGTR)框架,用于处理不同类型的交通代理。通过整合现成的LiDAR特征提取器的LiDAR语义特征,进一步增强了MGTR的功能。在Waymo Open数据集的运动预测基准测试中,MGTR展示了领先的性能,排名第一。
研究人员提出了一种用于越野驾驶中运动预测的神经符号方法,通过嵌入保守定律到数据驱动的神经模型中。实验证明该方法准确预测车辆运动,容忍外部干扰,且在准确性和效率方面优于现有方法。该方法展示了长期预测中的数据效率学习和泛化能力。
本文介绍了一种使用GPT风格的自回归方法来实现自动驾驶中的运动预测技术。该方法通过三个分解注意模块和不同的位置编码方式捕捉驾驶场景中的复杂关系。实验结果表明,该方法在Waymo Open Motion和Waymo Interaction数据集中取得了最先进的性能。
Occupancy Flow Fields是一种新的运动预测表示方法,使用深度学习生成,并引入流跟踪损失来建立一致性。该方法在占用预测、运动估计和代理重构等方面表现出有效性。此外,该方法还解决了轨迹集和占用格之间的局限性,并在大规模自动驾驶数据集上展示了优于现有技术的结果。
本研究提出了一个半监督学习框架,通过自我训练、伪标签选择和数据增强策略,在无类别依赖运动预测中使用较少标记数据的超越自监督方法,并达到了与弱监督和一些全监督方法相当的性能水平。
该研究提出了一个新的评估框架,用于提升人工智能设计需求的可靠性运动预测系统。同时,该研究还提出了意图预测层,以提升输出的可解释性和生成更平衡的结果。通过调查探讨了多模态轨迹和意图可视化中的不同元素来评估输出的可解释性。
完成下面两步后,将自动完成登录并继续当前操作。