H-COAL:用于生物医学命名实体识别的 AI 生成标签的人工校正
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种迭代方法,通过联合确定用人工分标注哪些样本和用训练有素的分类器进行标注哪些样本来最小化总体成本。作者在多个公共数据集上验证了该方法,结果显示总成本比完全使用人工标注数据集的成本低6倍,且始终比最便宜的竞争策略便宜。
🎯
关键要点
-
提出了一种迭代方法,通过联合确定人工标注和分类器标注样本来最小化总体成本。
-
该方法解决了云端注释服务生成数据集的高成本问题。
-
在多个公共数据集上验证了该方法,包括Fashion-MNIST、CIFAR-10、CIFAR-100和ImageNet。
-
结果显示总成本比完全使用人工标注数据集的成本低6倍。
-
该方法始终比最便宜的竞争策略便宜。
🏷️