深度学习模型在视觉识别任务中对部分物体遮挡的鲁棒性研究
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对深度学习模型在部分遮挡条件下的识别能力不足的问题,提出了基于现实和人工遮挡图像的图像识别遮挡数据集(IRUO)用于测试和基准评估主流方法的鲁棒性。研究发现现代CNN模型在遮挡图像上的识别准确率较早期模型有所提高,而ViT模型在遮挡图像上的表现更优,接近人类识别的准确率,但某些遮挡类型仍显著影响模型的表现。
本研究提出了一个图像识别遮挡数据集(IRUO),用于评估深度学习模型在遮挡条件下的识别能力。研究发现现代CNN模型在遮挡图像上的准确率有所提高,而ViT模型在遮挡图像上的表现更优,接近人类识别的准确率,但某些遮挡类型仍然会影响模型的表现。