香港中文大学(深圳)研究团队提出TRACE技术,通过因果事件建模提升视频理解能力,解决了传统视频检索效率低的问题。TRACE将视频结构化为时间戳、显著性分数和文本描述,显著提高了时序理解与定位精度,效果优于其他模型。
MMBench-Video是一个新的视频理解评测基准,旨在解决现有基准在长视频和复杂任务评估中的不足。该基准涵盖多种视频类型,采用高质量人工标注,评估模型的时序理解能力。通过对多模态大模型的测试,MMBench-Video提高了评估精度,为视频理解研究提供了重要工具。
完成下面两步后,将自动完成登录并继续当前操作。