使用大语言模型进行产品属性值的提取与规范化
原文中文,约300字,阅读约需1分钟。发表于: 。本文探讨使用大型语言模型(如 OpenAI 的 GPT-3.5 和 GPT-4)从产品标题和产品描述中提取和规范化属性值的潜力,并介绍了 WDC PAVE 数据集,通过实验展示 GPT-4 在产品属性值的提取和规范化上相对于 PLM 的方法获得了 91% 的 F1 得分,并且在字符串处理和名称扩展方面表现出色。
本文介绍了使用GPT-3.5和GPT-4等大型语言模型从产品标题和描述中提取属性值的潜力,并展示了GPT-4在提取和规范化产品属性值方面的优势。实验结果显示,GPT-4相对于PLM方法在属性值提取和规范化上获得了91%的F1得分,并在字符串处理和名称扩展方面表现出色。