本研究使用Large Language Models (LLMs)探究了使用LLMs进行人轨迹预测的可能性。通过生成物体过去/观察到的轨迹中的运动线索,并利用混合高斯聚类未来轨迹中的运动线索。采用基于Transformer的体系结构,展示了在行人轨迹预测基准数据集上的有效性,并进行了多个消融实验验证方法。
无监督视频对象分割任务旨在检测视频中最显著的对象。最近的方法使用光流图和RGB图像提取的线索。为了解决运动线索干扰问题,设计了一种新型网络,将运动线索视为可选项。通过随机提供RGB图像而不是光流图进行网络训练,降低了网络的运动依赖性。该方法在公共基准数据集上具有最先进的性能,且实时推理速度快。
该文章介绍了一种新型的多任务学习系统,将外观和运动线索相结合,以更好地对环境进行语义推理。该系统使用联合车辆检测和运动分割的统一架构,并在KITTI数据集上评估了该方法。结果表明,在运动检测任务上的性能优于其他利用运动线索方法21.5%,在通用物体分割任务上表现与现有的无监督方法相当。此外,运动分割与车辆检测的联合训练有益于运动分割。
该文介绍了一种新型的无监督视频对象分割方法,利用外观和运动线索检测视频中最显著的对象。该方法设计了一种新型运动作为选项网络,并提出了自适应输出选择算法。在所有公共基准数据集上具有最先进的性能,保持实时推理速度。
完成下面两步后,将自动完成登录并继续当前操作。