小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨了开源大型语言模型在使用公共数据时的毒性输出问题，提出了新的数据策划流程，开发了ToxicCommons数据集，并构建了Celadon分类器，以更有效地检测有害内容。研究表明，平衡的内容过滤方法能显著提升模型的安全性。

Toxicity of the Commons: Curating Open-Source Pre-Training Data

BriefGPT - AI 论文速递 ·

本研究提出了SELECT，这是首个针对图像分类的数据策划策略的大规模基准测试。我们创建了ImageNet++数据集，发现尽管新策划方法表现良好，原始ImageNet-1K的数据策划策略仍是评判标准。

SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification

BriefGPT - AI 论文速递 ·