本文介绍了多种深度学习模型在社交互动和视频理解中的应用,包括LAEO-Net用于检测相互凝视、InternVideo在Ego4D任务中的表现、半孪生卷积神经网络解决视频人物对应问题,以及基于鸟瞰视角的社交互动识别算法。这些模型在社交关系分析和视频理解方面表现出显著的性能提升。
完成下面两步后,将自动完成登录并继续当前操作。