该研究提出了一种新的统一时空图数据结构UniEdge,旨在改善行人轨迹预测中的时空交互建模不足问题。UniEdge通过简化高阶跨时间交互为一阶关系,有效捕捉时空依赖,实验结果显示其在多个数据集上显著提升了预测准确性。
本研究针对多目标跟踪中准确捕捉视频序列中物体的时空关系这一挑战,提出了一种创新的自适应关键帧挖掘策略,以解决现有方法的局限性。通过引入关键帧提取模块和帧内特征融合模块,显著提高了目标的可区分性,减少了由于遮挡导致的跟踪损失,最终在MOT17数据集上达到了卓越的性能。
本研究综述了面部表情识别中的图表示学习方法,探讨了图扩散、时空图和多流架构等新方法,揭示了其提升识别性能的潜力。
本研究提出了一种基于提示调优的连续预测方法,解决时空图预测模型在数据流环境中的重训练效率低和遗忘问题。通过优化存储提示的使用,提高了模型在交通流量、空气质量等场景中的预测效果和效率。
本研究探讨了群等变卷积神经网络(G-CNNs)的理论,提出了系统分类方法,并解决了特征空间之间的等变线性映射问题。同时,介绍了多种图神经网络模型,如EGNN和Equiformer,展示了它们在动态系统建模和时变图处理中的有效性。通过新架构和算法的引入,提升了模型的表达能力和数据效率,实验结果表明这些模型在多个数据集上表现优越。
本文介绍了一种名为VGT的视频图形转换器模型,旨在解决视频问答中的动态关系推理问题。VGT通过动态图形变换器模块编码视频,并结合视频和文本变换器进行问答,在多项视频语言任务中表现出色。此外,研究提出的多级对齐训练方案显著提高了视频与语言的语义对齐效果。
SpoT-Mamba 是一个新的 STG 预测框架,利用 Mamba 的长程依赖性来生成节点嵌入,通过节点嵌入进行时间扫描以捕捉长期的时空依赖性,并在实际交通预测数据集上展示了其有效性。
该研究提出了一种多模态学习框架,通过医学图像提取IDH基因突变特征,以预测胶质瘤基因型。实验结果表明,该模型优于传统深度学习方法,提供了新的预测手段。此外,研究还介绍了基于图神经网络的多种模型,提升了阿尔茨海默病和乳腺癌的诊断精度,展示了在肿瘤成长建模和MRI生成中的应用潜力。
本文提出了多种新颖的生成式预训练框架,以解决智能城市应用中的数据稀缺问题。GPDiff 和 MultiGPrompt 方法在交通速度预测和人群流动预测任务中表现优异,展示了良好的适应性和高效性。此外,研究引入了时空提示网络(STPN)和图形模型的多任务提示方法,提升了视频理解和图形任务的性能,具有广泛的应用潜力。
本文提出了一种名为MSDNet的基于窗口的事件去噪方法,结合时间窗口和软空间特征嵌入模块,能够高效去除事件噪声并提升下游任务性能。该方法在复杂场景中实现实时去噪,实验证明其有效性和鲁棒性。
本文介绍了一种新的交通预测框架ST-GDN,结合图神经网络和多尺度注意力网络,有效捕捉交通流量的空间和时间动态。实验结果表明,该框架在交通预测准确性上优于现有模型。
本文介绍了一种新颖的在线时空图轨迹规划器,能够生成安全且舒适的轨迹。通过构建时空图并传递给顺序网络,该规划器能够生成符合安全与舒适要求的状态。同时,还提出了一个简单的行为层用于确定轨迹规划器的动力学约束,并提出了一种新颖的潜力函数来训练网络。测试结果表明,该规划器能够生成安全、可行性高的轨迹,并在前进方向上达到相似或更远的距离,提供了可比较的舒适性乘车体验。
本论文提出了一种基于Transformer的短期电压稳定性评估方法,通过使用稳定性评估Transformer(StaaT)作为分类模型,并采用CWGAN-GP合成数据生成,解决了类别不平衡和数据噪声的问题。实验结果表明,该方法在类别不平衡和噪声环境下具有鲁棒性,并适用于可再生能源渗透的情况。该研究提供了一个适用于实际应用场景的解决方案。
互联需求增加导致物联网传感器过量。数字孪生是关键驱动因素,提出数字孪生本地AI驱动的服务架构,支持物联网网络概念。应用于车联网,通过TCP数据流水线节约了30%处理时间。测试多种学习速率组合,强调最成功的模型。
研究者提出了一种简洁时空模型ST-MLP,用于优化智能交通系统中的交通流管理。该模型结合了时间信息、空间信息和预定义的图结构,并采用通道独立策略,提高了交通预测的准确性和计算效率。实证结果表明,ST-MLP优于其他模型,鼓励进一步探索更简洁和有效的神经网络架构。
本文介绍了一种适用于非网格结构数据的新的知识蒸馏方法,通过提取局部结构信息并最小化分布之间的距离,实现了拓扑感知能力的知识传递,得到了轻量级但性能优异的学生网络。同时,该方法还应用于动态图模型,获得了在两个不同数据集上GCN模型的最新知识蒸馏性能。
本研究提供了一个新的词级孟加拉手语数据集(BdSL40),包含 611 个单词的 40 个视频,以及两种不同的分类方法。研究揭示了 BdSL、西孟加拉手语和印度手语之间的词汇和语义相似性,以及对 BdSL 缺乏词级数据集的情况。数据集和源代码已发布以促进进一步研究。
为了准确预测人群中行人的轨迹,需一直考虑其与其他行人的社会 - 时间相互作用。我们提出了一种完整的、明确的捕捉并分析该信息的表示方法,即基于有向无环图的社会 - 时间图(STG)。利用 STGformer 模型,我们实现了端到端的流程,学习 STG 的结构用于轨迹预测,并在两个大规模基准数据集上取得了最先进的预测精度。统计数据表明,利用这种信息明确进行预测相对于仅使用轨迹的方法能够明显提高性能。
该研究提出了一种基于骨架的动作识别框架,利用空间-时间梯度聚焦相关特征,并建立高阶空间-时间动态模型。通过梯度的空间-时间注意力指导分类器优化堆叠的STF模块,该方法在多个数据集上表现出竞争力的结果。
研究人员提出了一种名为STGNPP的时空图神经点过程框架,用于交通拥堵事件预测。该模型通过捕捉历史交通状态数据和道路网络的时空依赖关系,预测下一个拥堵的发生时间和持续时间。实验结果表明,该方法在性能上优于现有的最先进方法。
完成下面两步后,将自动完成登录并继续当前操作。