本研究探讨了开源大型语言模型在使用公共数据时的毒性输出问题,提出了新的数据策划流程,开发了ToxicCommons数据集,并构建了Celadon分类器,以更有效地检测有害内容。研究表明,平衡的内容过滤方法能显著提升模型的安全性。
本研究提出了SELECT,这是首个针对图像分类的数据策划策略的大规模基准测试。我们创建了ImageNet++数据集,发现尽管新策划方法表现良好,原始ImageNet-1K的数据策划策略仍是评判标准。
完成下面两步后,将自动完成登录并继续当前操作。