小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
解锁人工智能潜力:语言模型中的R1-Zero训练与知识编辑

R1-Zero训练和知识编辑为语言模型带来了新机遇。R1-Zero训练通过强化学习提高推理能力,减少对监督微调的依赖;知识编辑则允许模型实时更新信息,解决偏见和过度关注的问题。这些创新在客户服务和内容生成等领域展现出巨大潜力,提升AI系统的效率和适应性。

解锁人工智能潜力:语言模型中的R1-Zero训练与知识编辑

DEV Community
DEV Community · 2025-03-27T16:13:53Z

本文针对大型多模态模型在自主驾驶中的挑战,提出了知识编辑方法,并引入ADS-Edit数据集,以提升模型的性能和适应性。

ADS-Edit:一种用于自主驾驶系统的多模态知识编辑数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究提出了一种新方法CaKE,克服了现有知识编辑在多跳推理中的局限性。实验结果显示,CaKE在MQuAKE数据集上的推理准确性提高了20%。

CaKE:电路感知编辑实现通用知识学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了MindBridge,通过引入记忆模态解决知识编辑方法在特定模型上过拟合的问题,实现跨模型知识编辑,提高大语言模型的知识更新效率和准确性。

MindBridge: Scalable Cross-Model Knowledge Editing via Memory Augmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究提出选择性注意力漂移限制(SADR)方法,以解决大型语言模型知识编辑中的特定性失败问题,显著提升知识编辑效果。实验结果表明,该方法在多种模型中均有效。

揭示并缓解知识编辑中的过度关注问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出了一种新颖的知识编辑方法PALETTE,旨在改善大型语言模型(LLMs)的人格控制。该方法通过心理评估调整查询,系统性地调节模型回应,实验结果显示其在人格控制的稳定性和均衡性方面显著提升。

通过相关知识编辑实现语言模型的人格编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了一种新的知识编辑方法KEDKG,旨在解决大型语言模型在多跳问题回答中的知识需求。通过构建动态知识图谱,该方法显著提高了答案的准确性和可靠性。实验结果表明,KEDKG在动态信息环境中优于传统模型。

Knowledge Editing of Dynamic Knowledge Graphs for Multi-hop Question Answering

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

大型语言模型在文本理解和生成方面表现优异,但训练成本高且需频繁更新。本文定义了知识编辑问题,回顾了前沿方法,并提出了分类标准。引入新基准KnowEdit以评估知识编辑方法,分析知识定位,探讨其应用及影响。

面向视觉的细粒度知识编辑用于多模态大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

大型语言模型在文本理解和生成方面表现优异,但训练计算需求高,需频繁更新。本文定义知识编辑问题,回顾前沿方法,并提出统一分类:利用外部知识、合并知识和编辑内在知识。引入新基准KnowEdit进行评估,分析知识定位,探讨知识编辑的应用及其重要性。

基于自由文本的语言模型常识知识编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

新研究提出了一种名为RECIPE的方法,旨在提高大语言模型(LLM)知识编辑的效率。该方法通过检索增强的连续提示学习,使模型能够快速吸收新知识,避免昂贵的再训练。实验结果显示,RECIPE在多个基准模型上表现优异,能够有效纠正过时知识,同时保持模型性能。

免训练大模型知识编辑,吸收新数据更高效|EMNLP’24

量子位
量子位 · 2024-10-29T05:50:20Z

我们研究了大规模语言模型的事实知识随时间的保持情况,设计了动态基准评估18种模型的知识更新能力,并比较了知识编辑与检索增强生成的方法。

NewTerm:针对大型语言模型的新术语实时基准测试(年度更新)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z
NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

AIxiv专栏促进了学术交流,报道了2000多篇内容。研究提出了一种基于双重记忆机制的知识编辑方法WISE,旨在提升大模型的知识更新能力,解决机器记忆灵活性不足的问题。该方法结合长期和工作记忆,能够有效进行数千次编辑,提高模型的可靠性和泛化能力。

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

机器之心
机器之心 · 2024-10-23T12:56:45Z

本研究提出了评估平台HalluEditBench,针对大型语言模型的幻觉问题。通过构建涵盖9个领域、26个主题及6000多条幻觉的数据集,系统评估了知识编辑方法在五个维度上的效果,为未来改进提供了新见解。

知识编辑真的能纠正幻觉吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

该研究探讨大型语言模型在知识编辑中过拟合的问题,尤其是在多轮推理中高估编辑目标概率的现象。提出了评估基准EVOKE,并介绍了“学习推理”(LTI)策略,通过多阶段推理约束模块,减轻过拟合,优化编辑效果。

揭示大型语言模型编辑中的过拟合问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

我们提出了一种新的知识编辑方法,称为基于约束的解码,适用于大型语言模型。DeepEdit通过深度优先搜索进行渐进解码,提高推理连贯性和知识更新效果。无需访问模型参数,适用于所有黑盒语言模型。在MQuaKE数据集上表现优异,显著提升性能。

AlphaEdit:用于语言模型的零空间约束知识编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

知识编辑是更新语言模型中实际知识的技术,但研究发现可能导致知识扭曲和综合能力下降。本文讨论了这些副作用,并提出了改进方法的研究方向。强调需要深入理解和改进知识编辑方法。

受欢迎的实体从语言模型中删除知识时会产生灾难性的副作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

我们提出了一种新的知识编辑方法DeepEdit,通过深度优先搜索提高编辑效果。DeepEdit适用于所有黑盒语言模型,无需访问模型参数或输出词汇分布。在定性和定量上,DeepEdit都取得了显著性能提升。

对比知识解码:提高理解性语言模型对经过编辑事实的信心

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-19T00:00:00Z

PSPEM是一种新方法,解决了知识编辑方法的低效性和通用性问题。它通过自动寻找最佳软提示来克服提示工程的不透明性,实现了效率和准确性的最佳平衡。PSPEM在COUNTERFACT数据集上验证了其有效性,达到了近100%的编辑准确性和最高水平的流畅性。

通过重述前缀提示编辑语言模型的知识表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-21T00:00:00Z

大规模语言模型的知识编辑提高编辑器控制能力,多任务编辑设置中可提高14.86%可靠性。基于指令的知识编辑帮助控制优化方向,具有更强泛化能力。

KIWI:应答研究问题的知识密集型写作指南数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

深度神经网络在学术界和工业界越来越普遍,但会出错。为了解决这个问题,知识编辑作为一个新颖的研究领域正在兴起。本文回顾了神经网络编辑的问题、方法和数据集,并将其分为四个类别。同时,也提出了未来的研究方向。

传播与陷阱:通过反事实任务进行基于推理的知识编辑评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-31T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码