Swahili-text:华中大推出非洲语言场景文本检测和识别数据集 | ICDAR 2024 - 晓飞的算法工程笔记

💡 原文中文,约4400字,阅读约需11分钟。
📝

内容提要

该论文介绍了一个斯瓦希里语自然场景文本检测和识别的数据集,包括976张带标注的场景图像和8284张裁剪后的图像。该数据集旨在为斯瓦希里语开发全面的场景文本数据集,为评估现有模型提供基准,并帮助研究社区开发新的最先进方法。

🎯

关键要点

  • 该论文介绍了斯瓦希里语自然场景文本检测和识别的数据集。
  • 数据集包含976张带标注的场景图像和8284张裁剪后的图像。
  • 该数据集旨在为斯瓦希里语开发全面的场景文本数据集。
  • 斯瓦希里语是非洲使用最广泛的语言之一,但仍被归类为资源匮乏的语言。
  • 目前缺乏专门针对斯瓦希里语的场景文本检测和识别数据集。
  • 数据集的图像主要来自坦桑尼亚的城市和社交媒体,涵盖商店标签、广告等。
  • 每张图片在单词级别上进行了手动注释,确保准确性。
  • 数据集的收集和注释过程经过严格的质量控制。
  • 文本检测和识别任务的准确性依赖于高质量的标注数据。
  • 该数据集为评估现有模型提供基准,并帮助开发新的最先进方法。
➡️

继续阅读