本研究提出了一种新框架FlashVTG,旨在提高短视频片段检索的准确性。通过引入时间特征分层和自适应评分模块,FlashVTG在多个数据集上表现优异,尤其在短时刻检索中提升了125%的mAP。
本研究提出了一种多尺度图卷积模型用于骨骼动作识别,结合空间和时间特征,显著提升了识别性能。新模型如TGN、MS-AAGCN和ST-GCN在大规模数据集上表现优异,超越了现有技术。
完成下面两步后,将自动完成登录并继续当前操作。