黑盒大型语言模型的知识编辑
原文中文,约400字,阅读约需1分钟。发表于: 。当前研究主要关注白盒大语言模型(LLMs)编辑,忽略了一个重要的场景:黑盒 LLMs 编辑,其中 LLMs 通过接口进行访问,仅有文本输出可用。为了解决现有评估不适用于黑盒 LLMs 编辑且不具备全面性的局限性,我们提出了一个多角度评估框架,首次加入了风格保留的评估。为了解决当前方法中的编辑数据隐私泄露和过度编辑风格的问题,我们引入了一种新的 postEdit...
我们提出了一种新的知识编辑方法DeepEdit,通过深度优先搜索提高编辑效果,适用于所有黑盒语言模型,无需访问模型参数,定性和定量上都取得显著性能提升。