Swahili-text:华中大推出非洲语言场景文本检测和识别数据集 | ICDAR 2024 - 晓飞的算法工程笔记
💡
原文中文,约4400字,阅读约需11分钟。
📝
内容提要
该论文介绍了一个斯瓦希里语自然场景文本检测和识别的数据集,包括976张带标注的场景图像和8284张裁剪后的图像。该数据集旨在为斯瓦希里语开发全面的场景文本数据集,为评估现有模型提供基准,并帮助研究社区开发新的最先进方法。
🎯
关键要点
- 该论文介绍了斯瓦希里语自然场景文本检测和识别的数据集。
- 数据集包含976张带标注的场景图像和8284张裁剪后的图像。
- 该数据集旨在为斯瓦希里语开发全面的场景文本数据集。
- 斯瓦希里语是非洲使用最广泛的语言之一,但仍被归类为资源匮乏的语言。
- 目前缺乏专门针对斯瓦希里语的场景文本检测和识别数据集。
- 数据集的图像主要来自坦桑尼亚的城市和社交媒体,涵盖商店标签、广告等。
- 每张图片在单词级别上进行了手动注释,确保准确性。
- 数据集的收集和注释过程经过严格的质量控制。
- 文本检测和识别任务的准确性依赖于高质量的标注数据。
- 该数据集为评估现有模型提供基准,并帮助开发新的最先进方法。
➡️