本研究探讨了生成模型在产品属性值识别(PAVI)中的应用,提出了一种基于生成式框架的属性值提取方法。通过微调预训练的T5模型和多任务学习模型JPAVE,优化了提取和分类效果。新发布的MAVE数据集提供了丰富的商品和属性值注释,推动了研究进展。此外,使用大型语言模型(如GPT-4)在属性提取上取得了91%的F1得分。
本文介绍了使用GPT-3.5和GPT-4等大型语言模型从产品标题和描述中提取属性值的潜力,并展示了GPT-4在提取和规范化产品属性值方面的优势。实验结果显示,GPT-4相对于PLM方法在属性值提取和规范化上获得了91%的F1得分,并在字符串处理和名称扩展方面表现出色。
完成下面两步后,将自动完成登录并继续当前操作。