物种 196:一个百万级半监督数据集用于细粒度物种识别
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
介绍了BIOSCAN-Insect数据集,由专家手动标注,包含百万图像和遗传信息,具有长尾类别不平衡分布的特点,分类标签是分层分类方案,将促进机器学习社区对生物多样性研究的兴趣,推动创建基于图像的分类器的进展,为全球生物多样性的综合调查奠定基础。
🎯
关键要点
-
提出了BIOSCAN-Insect数据集,用于昆虫生物多样性的编目。
-
数据集由专家手动标注,包含百万图像和相关遗传信息。
-
提供原始核苷酸条形码序列和分配的条形码索引号。
-
数据集具有长尾类别不平衡分布的特点。
-
分类标签采用分层分类方案,提供细粒度的分类问题。
-
促进机器学习社区对生物多样性研究的兴趣。
-
推动创建基于图像的分类器的进展。
-
为全球生物多样性的综合调查奠定基础。
➡️