G-SPEED:通用稀疏高效编辑模型

原文约200字,阅读约需1分钟。发表于:

通过单一模型实现多样化编辑需求并保持低计算成本,我们提出了 G-SPEED(General Sparse Efficient Editing Model),其中包括一种新颖的无监督文本编辑数据聚类算法和一种稀疏编辑模型架构,实验证明 G-SPEED 可以超越拥有 175B 参数的 LLMs。

该研究使用大型语言模型提出了一种文本简化方法,并使用人工评估框架 SALSA 进行了评估。结果显示 GPT-3.5 可以比人类更优秀的进行简化但仍存在错误。同时,还提出了一种基于编辑注释的自动评估方法 LENS-SALSA,并报告了良好的初步结果。

相关推荐 去reddit讨论