基于大规模语言模型的商业与合规中的稳健产品分类
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了国际贸易中的产品分类问题,尤其是手动分类效率低下和错误率高的挑战。我们提出了利用数据扰动来实现真实数据模拟的创新方法,并通过基于大规模语言模型的分类提升了在不完整数据情况下的预测稳健性。研究结果表明,使用大规模语言模型的分类方法在干净数据情况下优于监督学习方法,并且在数据攻击出现时表现出更强的稳健性。
该论文使用预训练的多语言Transformer模型解决英语和波兰语文本下的产品匹配问题。mBERT和XLM-RoBERTa模型在英语测试中表现良好,优于最新解决方案。论文还制作了波兰语产品匹配任务的开放数据集,并展示了微调后的模型在该数据集上的基线结果。