哈尔滨工业大学与华为联合提出了AdaReTaKe框架,解决长视频理解中的冗余问题。该框架无需训练,通过动态压缩视频信息,使多模态模型处理长度提升至2048帧,性能在多个基准测试中超越同规模模型3-5%。此研究为长视频理解设立了新标杆。
完成下面两步后,将自动完成登录并继续当前操作。