小红花·文摘

本研究探讨了通过合成训练数据、主动学习和混合标注等策略，降低机器学习模型训练中的人工标注成本和时间。研究表明，混合标注设置能有效提高标注效率和数据集质量。

BriefGPT - AI 论文速递 ·

本研究探讨了命名实体识别（NER）的标注错误问题，提出了CrossWeigh框架和混合标注方法，结合人力与大型语言模型，提高了NER模型性能。实验结果表明，该方法在多个数据集上表现优越，有效解决了传统标注中的噪音和类别不平衡问题。

BriefGPT - AI 论文速递 ·

本文探讨了半监督学习在自然语言处理中的应用，特别是在命名实体识别和文本分类任务中。研究提出了一种新颖的混合标注方法，结合双向语言模型和人力标注，显著提高了模型性能，并有效解决了数据集中的噪音和类别不平衡问题。实验结果表明，该方法在低资源环境下表现优越，展示了利用大型语言模型提升数据质量的潜力。

BriefGPT - AI 论文速递 ·