物种 196:一个百万级半监督数据集用于细粒度物种识别

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

介绍了BIOSCAN-Insect数据集,由专家手动标注,包含百万图像和遗传信息,具有长尾类别不平衡分布的特点,分类标签是分层分类方案,将促进机器学习社区对生物多样性研究的兴趣,推动创建基于图像的分类器的进展,为全球生物多样性的综合调查奠定基础。

🎯

关键要点

  • 提出了BIOSCAN-Insect数据集,用于昆虫生物多样性的编目。

  • 数据集由专家手动标注,包含百万图像和相关遗传信息。

  • 提供原始核苷酸条形码序列和分配的条形码索引号。

  • 数据集具有长尾类别不平衡分布的特点。

  • 分类标签采用分层分类方案,提供细粒度的分类问题。

  • 促进机器学习社区对生物多样性研究的兴趣。

  • 推动创建基于图像的分类器的进展。

  • 为全球生物多样性的综合调查奠定基础。

➡️

继续阅读