本研究提出了一种新学习范式MLLM4WTAL,旨在改善传统弱监督时间动作定位方法的不足。该方法结合多模态大语言模型的语义匹配与重构模块,显著提升了定位性能,展示了在多种模型中的有效性与潜力。
完成下面两步后,将自动完成登录并继续当前操作。