通知系统中的时间交互模型 (TIM)

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文介绍了一种名为时间间隔机器(TIM)的模型,用于解决长视频中音频和视觉事件之间的相互作用。TIM通过将特定模态的时间间隔作为查询,将长视频输入馈入编码器,以识别正在进行的动作。实验结果显示,TIM在长音视频数据集上取得了最先进的识别结果,并在动作检测方面超越了先前的技术。

原文中文,约300字,阅读约需1分钟。
阅读原文