亚马逊AWS官方博客 ·

对图像内容进行精确分析案例实践

💡 原文中文，约4900字，阅读约需12分钟。

📝

内容提要

某出行企业通过多模态大模型和Amazon Rekognition，实现了油表油量的自动化识别，提升了租车业务的结算效率和用户体验，满足了油量结算的精度要求。

🎯

🔎

通过引入多模态大模型和Amazon Rekognition，该出行企业成功实现了油表油量的自动化识别。这一转变不仅提高了结算效率，还显著改善了用户体验，减少了人工操作带来的错误和延迟。

原始图像中存在大量噪音，影响了油量识别的准确性。因此，进行有效的去噪处理是提升识别效果的关键步骤。选择合适的视觉模型，如DINO V3，可以更好地应对复杂背景和低质量图像的挑战。

在油量识别中，采用回归模型而非分类模型是因为油量是一个连续数值。回归模型能够直接输出精确的油量占比，避免了分类模型带来的量化误差，更符合租车业务对结算精度的要求。

❓

通过使用多模态大模型和Amazon Rekognition自定义模型，结合去噪处理，实现油表油量的自动化识别。

DINO V3具备强大的特征提取能力和对复杂背景的鲁棒性，适合处理低质量图像，能够有效识别油表的核心特征。

通过将油量识别从人工环节转变为全自动化流程，显著缩短结算时间，提升用户体验。

油量分析中使用了多模态大模型和纯视觉模型，最终选择了基于DINO V3的回归模型进行油量预测。

通过去噪处理，定位油表区域后，再使用视觉模型进行定量分析，以提高识别效果。

模型在独立测试集上取得了94.67%的准确率，满足租车行业油量结算的精度标准。

🏷️