单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
2048帧视频12秒编码
智源研究院与上海交通大学联合推出开源视频理解模型Video-XL-2,该模型支持单卡处理万帧视频,编码2048帧仅需12秒。在长视频理解任务中表现优异,超越现有轻量级模型,具有广泛应用潜力,如影视分析和异常行为监测。
2048帧视频12秒编码
智源研究院与上海交通大学联合推出开源视频理解模型Video-XL-2,该模型支持单卡处理万帧视频,编码2048帧仅需12秒。在长视频理解任务中表现优异,超越现有轻量级模型,具有广泛应用潜力,如影视分析和异常行为监测。