人类在给予足够时间的情况下,以不常见的姿势识别物体时胜过深度神经网络
原文中文,约500字,阅读约需1分钟。发表于: 。深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中,我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现,与最先进的预训练网络(EfficientNet,SWAG,ViT,SWIN,BEiT,ConvNext)相比,人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是,当我们限制图像暴露时间时,人类的表现下降到深度网络的水平,这表明当人类在不寻常姿势下识别物体时,会进行额外...
深度学习与人类在物体识别方面的差距正在缩小,但在识别不寻常姿势的物体时,人类表现更好。然而,限制图像暴露时间后,人类的表现下降到深度网络水平。人类和网络的错误模式也不相似,因此需要更多工作来提高计算机视觉系统的鲁棒性。