无人工标注数据的文本分类LLM师生框架:以IPTC新闻主题分类为例
📝
内容提要
本研究解决了在无人工标注数据情况下的多语言新闻主题分类问题。提出的师生框架利用大型语言模型(LLMs),通过自动标注生成有效训练数据,取得了与人工标注者相当的表现,且学生模型展现出强大的零样本跨语言能力。这项工作表明较少的训练实例亦可实现高性能,并推动了多语言分类的进展。
🏷️
标签
➡️