大型语言模型进行政策文件的多类别分类
原文中文,约400字,阅读约需1分钟。发表于: 。使用 GPT 3.5 和 GPT 4 模型对议会法案和听证会进行分类,与人工干预程度相关的三种使用情景中,我们的结果表明完全依赖最小化人工干预的 GPT 不够充分,人工投入程度越高准确性越高,并在最需要人工干预的情况下取得了令人惊讶的高准确率。然而,优秀的使用情景中的 83% 准确率仅在两个模型达成一致的 65%...
本文研究了LLMs在广告宣传检测中的有效性,使用SemEval-2020任务11数据集进行了实验。结果表明,GPT-4在广告宣传检测方面达到了与当前最先进方法相当的结果。本研究还分析了LLMs在复杂任务中的潜力和挑战。