提升恶劣条件下车辆颜色识别的研究:一个数据集和基准测试
原文中文,约500字,阅读约需2分钟。发表于: 。本研究针对现有车辆颜色识别(VCR)研究中数据集复杂性不足的问题,编制了一个新的数据集,以反映更具挑战性的VCR场景。通过评估四种深度学习模型在该数据集和一个广泛采用的数据集上的表现,发现新数据集对模型的挑战性更大,特别是在夜间场景下的识别错误显著,为未来的VCR研究奠定了基础。
本研究引入了两个新的真实世界数据集,突出了光学字符识别和计算机视觉系统在极端环境下的不足。通过最先进的模型,在这两个数据集上建立了基准性能,结果显示通用模型表现不佳。经过微调后,模型性能得到了较大提升。然而,仍需要面向特定领域的技术来解决现实世界OCR和人物重新识别中的开放问题。数据来源于PerformancePhoto.co,已在该平台上部署最佳模型。