小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
刚刚,DeepSeek 又发新模型,小而美玩出新高度

DeepSeek发布了新模型DeepSeek-OCR,采用光学压缩技术,将文本转为图像,压缩率可达10倍,准确率超过97%。该模型通过DeepEncoder提取特征,支持多分辨率输入,具备深度解析能力,适用于STEM领域。团队还探索AI的“遗忘”机制,以提高超长上下文处理效率。

刚刚,DeepSeek 又发新模型,小而美玩出新高度

爱范儿
爱范儿 · 2025-10-20T10:14:24Z

本文研究了大型语言模型中的遗忘机制,提出三种对齐方法以删除有害回应、版权内容和幻觉。通过引入轻量级的取消学习层,框架有效更新模型,解决用户隐私问题。研究表明,结合梯度上升与下降的方法能提升模型性能,推动道德AI实践的发展。

面向大型语言模型的鲁棒且成本高效的知识遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文研究了大型语言模型中的遗忘机制,提出了一种高效的取消学习框架,以删除不受欢迎的输出并保护用户隐私。通过对机器遗忘的分析,建立了鲁棒基准,强调了在实践中平衡数据影响与模型实用性的挑战。研究结果推动了道德AI的讨论,并提出了改进遗忘算法的建议。

大语言模型解除学习的潜在表征引导效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

该研究提出了一种解码算法,用于生成开放性文本。该算法采用遗忘机制和长度惩罚,以解决过度惩罚导致的过短句子问题。实验结果表明,该方法有效地提高了生成高质量句子的能力。

惩罚解码:有效抑制开放式文本生成中的自我强化效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码