该报告介绍了团队在CVPR2024的Ego4D Looking At Me挑战中的解决方案,使用InternLSTM提取特征判断人是否面向佩戴摄像头的摄像机,采用Gaze Smoothing滤波器消除噪音或波动。在挑战中获得第一名,mAP为0.81,准确率为0.93。
完成下面两步后,将自动完成登录并继续当前操作。