小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
刚刚,DeepSeek 又发新模型,小而美玩出新高度

DeepSeek发布了新模型DeepSeek-OCR,采用光学压缩技术,将文本转为图像,压缩率可达10倍,准确率超过97%。该模型通过DeepEncoder提取特征,支持多分辨率输入,具备深度解析能力,适用于STEM领域。团队还探索AI的“遗忘”机制,以提高超长上下文处理效率。

刚刚,DeepSeek 又发新模型,小而美玩出新高度

爱范儿
爱范儿 · 2025-10-20T10:14:24Z

本文研究了大型语言模型中的遗忘机制,提出三种对齐方法以删除有害回应、版权内容和幻觉。通过引入轻量级的取消学习层,框架有效更新模型,解决用户隐私问题。研究表明,结合梯度上升与下降的方法能提升模型性能,推动道德AI实践的发展。

面向大型语言模型的鲁棒且成本高效的知识遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文研究了大型语言模型中的遗忘机制,提出了一种高效的取消学习框架,以删除不受欢迎的输出并保护用户隐私。通过对机器遗忘的分析,建立了鲁棒基准,强调了在实践中平衡数据影响与模型实用性的挑战。研究结果推动了道德AI的讨论,并提出了改进遗忘算法的建议。

大语言模型解除学习的潜在表征引导效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

该研究提出了一种解码算法,用于生成开放性文本。该算法采用遗忘机制和长度惩罚,以解决过度惩罚导致的过短句子问题。实验结果表明,该方法有效地提高了生成高质量句子的能力。

惩罚解码:有效抑制开放式文本生成中的自我强化效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码