本研究报告介绍了在CVPR 2024年的EgoVis挑战中的解决方案,包括Ego4D挑战和EPIC-Kitchens挑战。通过新型基础模型EgoVideo,基于视频语言双塔模型和自我中心视频数据,展示了其在不同自我中心视频分析场景中的多功能性和有效性。
完成下面两步后,将自动完成登录并继续当前操作。